很奇怪的是,哪个行业赚到钱,齐刷刷,目光就会对准它。学习搜索技术和关注搜索技术的原因很简单:

1. 信息的爆炸性,这100年创造的信息超过过去1000年创造的信息,特别是我们现在有了信息的电子化存储,给检索带来了工业化的革命。把信息分门别类,把信息整理,把信息加工,把信息检索出来,把信息提供给对口需求的人。都是极大提升效率,或大了说,提升生产力吧。所以我敢断言,庞大的外部互联网信息,已经成为现在IT人创业的自然资源,任何人,无论你现在有没有资源,有没有硬件,有没有技术,你都可以进入其中。

2. 这个领域是否存在寡头,寡头的存在是否不允许其它小鱼的生存。我的回答是否定的。寡头存在在于它可以有强大的资金和技术积累来获得绝对的门户效应。比如大家只知道google,baidu,yahoo.因为它已经成为门户,成为当之无愧的品牌。在资讯发达的今天,和闭目塞听的个人的两种矛盾下。通过广告,链接,口碑,等作用,无疑,寡头很容易起到把持门户,获得几乎50-90%的入口流量。这个是毫无疑问的。如过去,sina,yahoo,suhoo获得40-60%的桌面到达率一样。是不稀奇的。

3. 搜索本身不提供内容,而是提供指路牌作用,天然的,其它网站,小门户,行业网站,垂直搜索可以通过作好内容,SEO,链接,口碑等方式从门户搜索获得逐渐多的流量,慢慢培植自己的势力。比如酷讯,人才类网站,b2b网站,通过适当优化,购买流量,或是广告链,可以迅速获得巨大的流量。因为检索的范围,行业,领域不同,关注度不同,平面搜索天然不能作细化,垂直搜索天然难于作门户。

4. 客户的终极目标还是要最快的获得自己需要的讯息,现在我们看到,光靠一级的平面检索,还不能获得生产效率的极提高。或者,为了隐藏直接的路径来获得多页面,进而获得广告收入,获得多的pv,很多网站繁文缛节,层层迭迭。这给检索技术带来技术上的必要性。

5. 检索是个多层次的技术需求。我们需要检索。这是现实,从互联网捞取信息点,获得信息点后,进入到网站,我们仍然需要全文检索,需要tag,需要xml技术,才能迅速找到信息条目。而如果信息要横向和纵向比较,仍然需要检索技术。信息要深层次挖掘,也需要检索的相关技术。可以看出,检索是立体,纵向,交叉,多元的。

6. 小搜索,小检索存在的环境。正如海洋生物圈一样,有统治者,寡头,但仍然有千奇百怪的,大小不一的各类生物组成一个生存链。海洋才得于平衡和发展。既然这是事物得规律,我想通过哲学的类比,搜索圈也是如此。

7. 后来者你应该关注什么。后来者你可以关注的更细化的某些层面。甚至可以采用不同的切工,来切出纵横交错的,适应不同层面的需求,加以搜索技术。必然有它的存在,长尾效应我们不用提了。我们不能去作到处处,事事争第一,然而我们能服务我们的受众。逐渐壮大,还是有市场可为的。你能获得10WIP流量你就能生存,你能获得30-50wIP流量你就能出现现金流,如果你能作到100wIP,你就是小门户了。

8. 小搜索细化需求,与需求更近,与具体内容更近,与信息更密切,也就说明,你会更专业,你会极大提高受众的粘度。因为在你的下层用户,就是实际的信息使用者。更明确的说,小搜索我觉得是基与内容,基与信息本身作的内容提供者。因而这种服务是基层的。但受众是确切的。是定位清晰的。是容易产生价值转化的。

9. 关于资本进入限制。如果你立意在小的搜索上,那在技术难度,门槛,竞争性,存储难度,检索难度上都不是主要问题,问题反而转化到你对内容本身的理解,对你的直接客户的服务深度上。资本的问题我想在硬件层面上不存在问题。大量开源的软件技术是可以应用和改造的,架构上我们分布也可,集中也可,我们可以运用廉价的设备,价格低廉的存储器,2个,甚至一个人到5个,10个人的开发团队来作开发和维护足以完成和运营一个小搜索。讯雷用20w支撑了一年的现实告诉我们。这种开发新产品的压力绝对不是yahoo能应对的。因为只要有一点基础,你就可以从事前期的研究。注入一点资金,你就可以起来。我有转载其它的文章。可以看出,类似web2.0不需要资金,或说小量的资金就可以创业,甚至作出门户,也是不惊奇的。因为,搜索不是神秘的东西。web2.0也不是一个神秘的东西。关键是用户的细化需求恰恰能释放给你。你可以一夜成名。

10. 开源技术与实际运用。我们看到,现在的开源技术,几乎可以在不加任何处理的条件下,就可以实现一个模型测试,但我们要看到,实际的运用复杂程度远远不是你弄个测试模型就能成就的。要了解客户之需,深层次的了解,然后设计适当的模式,硬件架构,服务模式,资金问题,推广问题。。。。等等,都不是一个测试模型能解决的问题。开源的好处是使得搜索不再神秘,使得进入门槛降低,使得开发加速,使得定制化容易,使得搜索大众化,普及化,非垄断化。

11. 关于镀金问题和自立门户之路。诚然,或许很多人从google,baidu出来真的拷贝了它们的创业密码。但我们要看到,由于一些协议的限制,他们是无法自立门户的。只能在比较远的层面开展工作,而且这样的基础,不是我们每个人都具有的。而且他们的技术更在于海量,速度,算法上。很多先例表明,他们带出来的只有对行业的认识,对以后创业时的直接受用不是很多。优点在于他们的认知程度不在我们一样的档次(当然他们的价格,也不是谁都能把他纳入麾下的。)。也就是说他们有很多人力圈子的资源,技术积累的资源,但涉及到实际的运用,还得加以复杂得开发,另起炉灶(讯雷的创业者是baidu的企业搜索开发部门的人才,但领域不同,还的从零开始)。

12 .学习搜索,就业可观。在csdn里,很多玩c++,linux,nutch,lucene有经验的人,我看过他们得blog,他们都得到过很多作垂直搜索,作行业搜索的HR,老总们的橄榄枝。比如某人得到职友集老板的询问。呵呵。我对这个有些了解。因为在这个方面,人才缺口是1:40。可以预见,是蛮有前途的行当。

写不下去了。。。这是我最近读文章的感受。以后有认识再总结。。