乐胖代购免代理版

我的友情链接

原创 2017-11-22 23:12:47 373 阅读

Django+uwsgi+nginx配置详解

操作系统是ubuntu更新源1apt-get update安装 Nginx 和 uWSGI1apt-get install nginx uwsgi uwsgi-plugin-python安装 Python 相关环境1apt-get install python-dev python-virtualenv py

ubuntu

python

原创 2015-08-05 08:58:42 1153 阅读

使用DjangoUeditor将Ueditor移植到Django（BAE环境下）

UEditor是百度出品的开源富文本编辑器，BSD协议，外观、功能都不错。DjangoUeditor是UEditor在Django上的移植版项目地址https://github.com/zhangfisher/DjangoUeditor由于UEditor没有出python版本，所以DjangoUeditor几乎是最简便的现成工具，但是要将DjangoUedtor移植到BAE上，还需要做一些改动。1

django python

转载精选 2015-06-10 18:26:24 1139 阅读

linux sort,uniq,cut,wc命令详解

sortsort 命令对 File 参数指定的文件中的行排序，并将结果写到标准输出。如果 File 参数指定多个文件，那么 sort 命令将这些文件连接起来，并当作一个文件进行排序。sort语法[root@www ~]# sort [-fbMnrtuk] [file or stdin] 选项与参数：-f ：忽略大小写

linux SEO

转载精选 2015-06-10 14:25:41 560 阅读

用shell进行log分析--老狼

ITSEO学员老狼投稿文章首发，转载请注明出处！锄禾日当午,日志分析为何非要费时一上午呢………………..一、开篇要说的话为何要日志分析昆哥说了：“首先要知道数据做什么用，怎么用，分析的意义在哪里！但是本身这个只是指导你工作决策的，不能太执迷！我看很多人把大量时间都在折腾蜘蛛去了，也是不正确的方法！自己一定要搞清目的。。。。。“夜息说了：“日志分析关注的点要了解，要了解哪些维度，如何分析

SEO

转载精选 2015-06-10 14:19:25 1806 阅读

搜索意图三分法：用户搜索行为及其意图浅析

搜索行为目前已经成为每个上网的人的基本需求，但是用户的搜索行为是怎样一个过程?隐藏在用户查询背后的搜索意图是什么?这都是需要站长、营销人员仔细研究的领域，只有这样才能提供更好的用户体验。用户搜索行为用户之所以会产生搜索行为，往往是在解决任务时遇到自己不熟悉的概念或者问题，由此产生了对特定信息的需求，之后用户会在头脑中逐步形成秒速需求的查询词，将查询提交给搜索引擎，然后对搜索结果进行浏览，如果发现搜

SEO

转载精选 2015-06-10 11:40:38 1567 阅读

xpath提取多个标签下的text

title: xpath提取多个标签下的textauthor: 青南date: 2015-01-17 16:01:07categories: [Python]tags: [xpath,Python,xml,scrapy]---本文首发在 http://kingname.info在写爬虫的时候，经常会使用xpath进行数据的提取，对于如下的代码：<div id="test1

XPATH

转载精选 2015-05-07 10:53:23 1774 阅读

SEO最近的一份成绩单

总觉得可以做的更好的。大神看到了勿喷..

SEO

原创 2015-04-28 18:11:09 274 阅读

Python下的Mysql模块MySQLdb安装详解

1、下载 MySQL for Python 地址：http://sourceforge.net/projects/mysql-python/files/mysql-python/我这里安装的是1.2.3版本复制代码代码如下:wget http://sourceforge.net/projects/mysql-python/files/mysql-python/1.2.3/My

mysql

python

转载精选 2015-04-09 15:21:14 407 阅读

Python怎么使用beautifulsoup来从HTML片段中删除标签

soup.get_text()使用get_text()方法即可一直没找到，保存一下。

标签

HTML

python

原创 2015-03-27 18:20:21 2714 阅读

ubuntu vim中文乱码问题

转载：添加中文字符编码：$sudo vim /var/lib/locales/supported.d/local#添加下面的中文字符集zh_CN.GBK GBK zh_CN.GB2312 GB2312 zh_CN.GB18030 GB18030使其生效：$sudo dpkg-reconfigure localesvi

source

ubuntu

中文

配置文件

local

转载精选 2015-03-26 15:37:15 654 阅读

最近在学VIM。记几个命令。

shift+v 选行，然后上下键，选代码块shift+> 或者shift+< 左右移动代码块U 回退任意操作VIM配置" tab to 4 spaces set smartindent set tabstop=4 set shiftwidth=4 set e

命令

python

VIM

原创 2015-03-19 10:37:13 250 阅读

安装lxml模块记录

安装这个模块坎坷颇多首先确认ubuntu源。。我的版本是14.04.去找了官网的元替换source.list然后apt-get update在用pip和easy_install安装LXML的时候会提示少两个包** make sure the development packages of libxml2 and libxslt are installed **需要安装libxml2和li

服务器

ubuntu

update

python

原创 2015-03-17 13:44:36 1015 阅读

Chrome无法登陆账户同步信息解决方法 SSH代理模式

1、首先有一个国外的VPS。linode、ramnode都可以，能ssh登陆就行。2、使用工具MyEnTunnel，用ssh代理链接3、火狐下载FoxyProxy Standard插件，设置代理为socks5...代理主机为本地主机127.0.0.1，端口号和myentunnel一致。4、火狐打开foxyproxy的chrome版，然后使用http://chrome-extension-downl

代理

chrome

账户同步信息

原创 2015-02-27 16:12:17 829 阅读

Django模板中的HTML自动转义

在用bs4的rendercontents()方法获取到html片段的时候，输出到html模板中，是会对尖括号进行转义，从而导致输出错误。使用标签自动转义，可以取消django的默认设置。做Web开发的人都明白，我们应该避免在用户输入信息中出现HTML标签。比如考虑下面的Django模板信息：Hello ` name `.这看起来没什么问题，但是假如用户输入的name是下面这样的信息就麻烦了：浏览器

浏览器

标签

过滤器

对话框

escape

转载精选 2014-12-12 00:10:05 1303 阅读

python字符串匹配工具性能比较

做敏感词过滤的时候要用到字符串匹配，从一个文件中读入需要匹配的敏感词，和一段文本去匹配，用string的find方法是不太合适了，搜了一下，发现AC自动机的方式更好。AC自动机是一个可以用来快速进行多关键字匹配的数据结构，具体信息可以参见这篇经典的论文：Efficient string matching: an aid to bibliographic search再找了一下，python有几个扩

搜索引擎

关键词

search

python

matching

转载精选 2014-12-01 16:50:53 10000+阅读

Django+nginx+uwsgi+linux生产环境搭建

linux：Ubuntu 12.04 64位python：自带2.7.3django 1.7.1nginx:1.1.19uwsgi:使用pip安装，版本不详更新源apt-get update安装 Nginx 和 uWSGIapt-get install nginx uwsgi uwsgi-plugin-python安装 Python 相关环境apt

python

输入密码

原创 2014-11-26 20:35:09 1711 阅读

Django开发中使用Google custom search API

我们的网站通常都要集成搜索服务。通常情况下，我们都使用自己的搜索后端，例如使用Django，对于Python，我们主要有两种选择，一种是Whoosh，它是纯Python写成的搜索后端；另一种则是著名的Lucene的Python扩展，PyLucene，要提醒使用PyLucene，需要安装JVM。以后的文章我会介绍他们。不过，今天的主角显然不是它们。因为有时候，我们并不需要这么麻烦，有时我们只需要集成

Google

search

iframe

custom

搜索结果

转载精选 2014-11-18 11:26:52 1575 阅读

v9切换ueditor后图片上传路径问题改成绝对路径

使用V9切换成ueditor编辑器后，图片上传路径显示的是相对路径，同时会把content字段第一张图这个路径同步到缩略图的thumb字段。thumb字段如果是相对路径的话，前端就不能进行裁剪，APP或者其他应用也不能调用。于是修改。我用的是1.4.3版本找到编辑器目录下的/php/Uploader.class.php文件。找到getFileInfo()方法，修改成如下代码

php

phpcms

ueditor

原创 2014-10-28 18:28:18 1473 阅读

分享一个搭建流量频道的经历

最近接触了一个很小众的行业，行业本身的搜索流量很小。朋友来问我SEO该怎么做。于是有了这次经历，目前各项数据都还在测试观察中。好了开始。仔细研究了一下他所在的行业，发现虽然是一个新兴的小众的行业，但是能跟娱乐类的信息扯上关系。于是准备搭建一个明星资料库来引入一批流量。由于这个朋友是技术出身，技术也比较牛，于是几乎把想到的东西都实现了。首先从词库入手，既然是搭建明星资料库，那么从获取明星名字开始，这

SEO

流量频道

原创精选 2014-07-14 16:17:00 713 阅读 2点赞 1评论

记不住linux命令，记录一下

1.进入存放日志的文件夹cd d:/1112.查看该文件下所有文档ls3.合并日志或其他文件cat *.log > example.log #合并后缀为log的日志文件cat 1.log 2.log > 3.log #合并指定的日志4.提取百度蜘蛛(如果有错误，请参考：http://www.lirang.net/post/38.html)grep "Baiduspider" examp

服务器

SEO

原创 2014-07-09 10:30:40 953 阅读

先验概率和后验概率

搜索引擎是一个没有生命的程序，它是不能够像人类一样进行思考的，它的一切行为都依赖于算法。搜索引擎也有它特定的思考方式，我们称为　“机器学习”　或　“人工智能”　，但是这一切的前提是基于大数据。接下来，我通过一些点来说明它是如何思考的。一、跳出率（搜索跳出率）首先如果你的网站没有放置搜索引擎的相关产品代码（如：百度分享，百度统计），或者你的浏览器

seo

转载精选 2014-07-07 19:02:35 1222 阅读

浅谈互联网页面价值

搜索引擎每天处理着数以亿计的查询请求，每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候，通过查询返回的网页结果，这些需求被满足了，我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言，页面的价值是指什么，我们为什么要研究页面价值，技术上怎样判断页面的价值呢？本文将逐一回答这些问题。一、什么页面价值前面我们说了，某个页面满足了某一用户的特定需求，就体现了这个页

SEO

转载精选 2014-06-30 11:09:15 210 阅读

nginx防止跨站 lnmp多站点安全设置之一

一台服务器很少只给一个网站使用，站点多了，管理员有勤堕之分，技术水平也不一样。所以必要的还是做些安全设置。记录一下，以后能用的上。第一步是到/usr/local/php/sbin/目录打开php-fpm文件，找到case "$1" in start) echo -n "Starting php_fpm " $php_fpm_BIN&nb

SEO 服务器

原创 2014-05-15 15:04:46 1606 阅读

Lynx浏览器在SEO上的应用

曾经有朋友问我怎么才能判断一个SEOer是不是高手。我就出了一个主意，就建议他问那个SEOer是不是知道Lynx在SEO上的应用方法。这么来提问，其实能从一个侧面反映这个SEOer对SEO研究有多深的。现在SEO行业，虽然有很多以讹传讹的言论，但是如果自己经常实践，还是能找到很多真正有用的操作方法。实践久了，也能判断谁的说法正确，谁的说法有问题，这样的SEOER，可以放心的让他去操作一些比较重要的

SEO

转载精选 2014-05-15 15:03:46 587 阅读

virtualbox中ubuntu和windows共享文件夹设置

系统平台：win8.1、virtualbox4.3.8、ubuntu12.041、安装VBoxGuestAdditions_4.3.8.iso增强工具，安装完毕后根据提示重启Ubuntu，具体操作如下：a、把VBoxGuestAdditions_4.3.8.iso镜像到Ubuntu中，存放在Ubuntu的/media目录中，操作如下：b、安装virtualbox增强包linjiqin@ubuntu

SEO

转载精选 2014-05-15 15:03:12 401 阅读

使用shell分析日志

一、开篇要说的话为何要日志分析昆哥说了：“首先要知道数据做什么用，怎么用，分析的意义在哪里！但是本身这个只是指导你工作决策的，不能太执迷！我看很多人把大量时间都在折腾蜘蛛去了，也是不正确的方法！自己一定要搞清目的。。。。。“夜息说了：“日志分析关注的点要了解，要了解哪些维度，如何分析。。。。。“二、本文正题这里我就整理了下，本人经常拆份的一些项。Shell在Cygwin里跑的一些常用命令符语句,

SEO

转载精选 2014-05-15 15:02:36 375 阅读

CDN及虚拟主机用户须慎重辨别假百度蜘蛛

对于真假百度蜘蛛，相信SEO及站长们已经有明确的手段去辨别了。百度也在官方通告了如何去判别伪装成百度蜘蛛的抓取。CDN及虚拟主机用户须慎重辨别假百度蜘蛛。假蜘蛛对我们网站的危害是巨大的，具体有：1.占用网站带宽，导致网站流量上升，增加额外开销2.在有限带宽的前提下，阻碍了正常蜘蛛的抓取3.误导了我们在对网站开展SEO工作时的思路4.部分伪装成假蜘蛛的采集工具剽窃了我们的工作我们看到，网上有很多人在

SEO

转载精选 2014-05-15 15:01:52 666 阅读

HTTP头信息解读

正确的设置HTTP头部信息有助于搜索引擎判断网页及提升网站访问速度，本文为多篇“HTTP请求头相关文章”及《HTTP权威指南》一书的阅读后个人汇总整理版，以便于理解。通常HTTP消息包括客户机向服务器的请求消息和服务器向客户机的响应消息。客户端向服务器发送一个请求，请求头包含请求的方法、URI、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应，相应

SEO

转载精选 2014-05-15 15:01:17 314 阅读

SEO过程中避免无意的作弊行为

现在标签这些方法越来越普及，很多人在做SEO的时候不知不觉的就会出现“无意作弊”的现象，其实我们是无意的，但是那确实触犯了搜索引擎的底线。比如重复页面问题。

SEO

原创 2014-05-15 14:58:58 291 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

刀心

我的友情链接

Django+uwsgi+nginx配置详解

使用DjangoUeditor将Ueditor移植到Django（BAE环境下）

linux sort,uniq,cut,wc命令详解

用shell进行log分析--老狼

搜索意图三分法：用户搜索行为及其意图浅析

xpath提取多个标签下的text

SEO最近的一份成绩单

Python下的Mysql模块MySQLdb安装详解

Python怎么使用beautifulsoup来从HTML片段中删除标签

ubuntu vim中文乱码问题

最近在学VIM。记几个命令。

安装lxml模块记录

Chrome无法登陆账户同步信息解决方法 SSH代理模式

Django模板中的HTML自动转义

python字符串匹配工具性能比较

Django+nginx+uwsgi+linux生产环境搭建

Django开发中使用Google custom search API

v9切换ueditor后图片上传路径问题改成绝对路径

分享一个搭建流量频道的经历

记不住linux命令，记录一下

先验概率和后验概率

浅谈互联网页面价值

nginx防止跨站 lnmp多站点安全设置之一

Lynx浏览器在SEO上的应用

virtualbox中ubuntu和windows共享文件夹设置

使用shell分析日志

CDN及虚拟主机用户须慎重辨别假百度蜘蛛

HTTP头信息解读

SEO过程中避免无意的作弊行为

欢迎