搜索引擎三大定律

Author: 信海光 Date: 2001年 40期

?牐犜谒伎剂撕芫靡院螅俣却词既死钛搴曛沼诰龆ㄎ渌阉饕娣裾乙桓鍪辗训耐揪丁饧负跻馕蹲耪鏊阉饕媸谐《伎际辗蚜耍蛭俣日剂熳胖泄阉饕媸谐〉陌胧陨系姆荻睿吕恕⑺押榷荚谑褂冒俣忍峁┑姆瘛?
  ?牐犜诎俣确⑵鸬闹魈馕澳阆胍模谡夷恪钡幕チ阉饕婢杭叟琶裰校没ВㄍǔN笠担┛梢晕约旱耐吵鲎使郝蚬丶峙琶吹慊骷品眩吹崩盟阉饕娼行畔⑺阉魇保阉鹘峁琶谰菘头课霉丶志杭鄣亩嗌儆筛叩降徒信帕小?
  ?牐牰杂诓渭泳杭叟琶笠道此担绻杏没?通过百度的搜索引擎排名访问了自己的网站,它需为每次访问付费一毛钱。
  ?牐牬饲埃俣冉阉饕娴氖褂萌ǔ鋈眯吕说韧静⑹杖∈褂梅眩瞥龃舜问辗严钅亢螅俣雀诵吕恕⑺押橇礁鲅≡瘢灰皇羌绦虬俣戎Ц妒褂梅眩渭悠浯淼钠笠底⒉岱逊殖桑欢遣徊渭臃殖桑恢Ц叮ɑ蛏僦Ц叮┦褂梅选>菟担负跛械耐径佳≡窳饲罢摺?
  #1    三大定律
  ?牐犠魑桓鏊阉饕娣矫娴募际醺呤郑庖丫抢钛搴甑牡谌瓮黄屏恕T诖酥埃丫岢隽怂阉饕娣矫娴牧教醵?律了。
  ?牐牭谝欢?律是相关性定律。也就是说,当用户输入检索词时,搜索引擎去找那些检索词在文章(网页)中出现频率较高的,位置较重要的,再加上一引起对检索词本身常用程度的加权,最后排出一个结果来(检索结果页面)。早期的搜索引擎结果排序都是基于这一定律的,如Infoseek,Excite,Lycos等,它们基本上是沿用了网络时代之前学术界的研究成果,主要精力放在处理大访问量和大数据量上,对相关性排序没有有突破。词频统计其实根本没有利用任何跟网络有关的特性,是前网络时代的技术。然而,网络时代的主要文献是以网页的形式存在的,而几乎每个人都可以随心所欲地在网上发表各种内容,词频相同的两个网页,质量相差可以很远。为了能排在某些检索结果的前几位,许多网页内容的制作者绞尽缡汁,在其页面上堆砌关键词,搜索引擎对此防不胜防,苦不堪言。
  ?牐犖擞Χ哉庵智榭觯?1996年,李彦宏发现了第二定律。1996年4月,李彦宏到赌城拉斯维加斯开一个有关信息检索方面的学术会议。就在听一个毫不相干的论文演讲的时候,李彦宏突然把科学引文索引的机制跟Web上的超级链接联系起来了。科学引文索引的机制,说白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移植到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。再加上相应的链接文字分析,就可以用在搜索结果的排序上了。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果的相关性排序,并不完全依赖于词频统计,而是更多地依赖于超链分析。
  ?牐犂钛搴暌馐兜秸馐且桓鐾黄菩缘亩鳎厝ヒ院缶秃芸熳芙崃怂悸罚?1996年6月申请了这一方面的美国专利。1999年7月6号,美国专利和商标局批准了专利号为“5,920,859”,以李彦宏为唯一发明的专利。超链分析的方法1998年以后逐渐被各大搜索引擎所接受,由于链接是网络内容的一个根特性,这时候的搜索引擎才开始真正利用网络时代的检索技术。
  ?牐犎欢朗履蚜希?2000年起网络泡沫迅速破灭,各大搜索引擎要么遭人收购,要么推迟上市,所有使用人气质量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路到底在哪儿?
  ?牐犂钛搴曜芙岢隽说谌?律:自信心定律。他认为:人气质量定律解决的还只是一个技术层面的问题,然而搜索引擎从诞生的那一天起,从来就不是一个纯技术现象,它融合了技术,文化,市场等各个层面的因素。解决搜索引擎公司的生存和发展问题需要搜索引擎的第三定律——自信心定律。
  ?牐?1998年的时候,没有太多的人拿一家远在硅谷500英里以外,刚刚成立的,叫作GOTO.COM的公司当回事儿。它们不过是买了一个搜索引擎的技术服务,然后再向那些网站的拥有者们拍卖他们网站在GOTO.COM检索结果中的排名,谁付的钱多,谁的网站就排在前面,而且付费是根据网民点击该网站的情况来计算的,仅仅在搜索结果中出现并不需要付费。这就是自信心定律的最早实践者!
  ?牐犂钛搴暝谝黄恼吕镌吹溃骸敖裉欤谕缫狄黄籼酰伤勾锟朔缟奏Φ氖焙颍珿OTO.COM却如日中天,市值高达13亿美金,收入高达雅虎总收入的35%。反观门户网站,有哪一个能从它们的搜索引擎服务中赚出总收入的三分之一呢?”究其原因,就是因为GOTO最早实践了搜索引擎的自信心定律。以前的搜索引擎都是靠CPM(第千次浏览成本,cost per thousand ad impressions)来收费的,而CPM是从传统广告业借鉴过来,没有考虑网络媒体即时性、交互性、易竞价的特点,而竞价排名,点击收费则是为网站拥有者直接提供销售线索,而不是传统意义上的广告宣传。自信心定律一改过去搜索引擎靠CPM收钱的尴尬局面,开创了真正属于互联网的收费模式。”
  #1    争议
  ?牐犞灰怯擅夥炎蚴辗训姆窬涂隙ɑ嵋鹫椋诨チ贝饧负跻丫闪艘桓龉崂?
  ?牐牨鹊缱佑始辗焉院靡坏愕氖牵獯嗡阉饕媸辗阎徽攵约尤胨阉饕娴钠笠担徽攵允褂谜摺N抟纱由桃到嵌壤唇玻运阉饕媸辗丫哂芯薮蟮睦媲熬埃莸鞑橄允灸壳爸泄チ没е杏?51.3%的用户经常使用搜索引擎,其中57.5%的用户得知新网站的主要途径就是搜索引擎,所有访问者均具有极强的针对性和倾向性,绝大部分都是企业未来的潜在目标客户。因此可以肯定此种系统的推出将是一种非常有效的让目标用户直接认识、了解企业的最佳途径之一。
  ?牐犜诶钛搴甑募苹校恍┤让诺摹⑸桃导壑蹈叩拇驶憬峋旱煤芨叩募鄹瘢热纭笆只薄?
  ?牐牭谴讼罹俅牖岵换嵊跋炱浞裰柿磕兀吭谑允褂弥校钦咚阉鳌八镅?校”一词,果然出现在最前面的是一些已交费的网站,值得担心的是,如果交费的企业太多的话,岂不是会影响普通网民的使用效率,比如,在检索一个网页的时候,很可能翻了好几页才绕过前面那些交费的商业网站链接。
  ?牐牬司俚墓丶牵诿挥惺敌械谌?律以前,百度的服务原则是以风包的方便为核心,而在第三定律中,则是以交费客房的利益为核心,这个转变,是不是会影响搜索引擎的服务质量?更远一点的担心是,在这个服务中,搜索引擎的一大职责是尽量减少商业欺诈,如果一旦其链接的商业网站出现问题的话,因为收费的缘故,搜索引擎将难辞其纠。
  ?牐犂钛搴暝蛉衔绻辗训幕埃芄皇狗窀佑斜U希袒?推荐实际上了方便了消费者,他坚持认为这样将促进互联网的发展。
  ?牐犞档靡惶岬氖牵ü阉饕孀⒉崾辗巡⒉皇前俣鹊氖状矗诹硪恢阉饕鍳oogle上,亦早有此种服务,只不过没有百度范围如此广罢了。