Google在华涉嫌“抄袭”内幕

事件

2007年4月4日,Google这个被认为是网络先锋技术代表的互联网公司,终于放弃在中国只进行英文产品汉化的一贯作风,发布了一款为中国网络用户量身打造的拼音输入法,意在以本土化的体验增强用户吸引力。

让Google料想不到的是,自己精心推出的输入法很快陷入抄袭风波,最后引发输入法词库版权问题的大争论。

盗用风波平地起

Google的Google拼音最初只是由Google的一个实习生在业余时间提出的创意,然后再被设立为专门的研究项目,但开发人员也仅仅就是多增加了一个实习生。

自去年以来就一直有传言说Google拼音即将发布,如今时隔一年之后才发布,许多人认为虽然Google拼音在输入法上迈了一小步,却在Google本地化上迈了一大步。

不过在4月4日下午,Google拼音发布不到4个小时,就有用户贴出贴子,指责Google拼音“抄袭”了另一网络公司搜狐的搜狗输入法词库。因为在Google拼音的词库文件中居然能够打出许多搜狐开发人员的生僻姓名和外号,甚至对搜狗拼音输入法犯的词汇错误,Google拼音也一并“抄袭”下来。

据本报记者调查,搜狐开发人员为了防止其词库被用户非法使用,人工干预了通过搜狗搜索生成的词库文件。在公开发布的词库文件中加入了自己开发人员的姓名如“赵立洋”、“茹立云”、“佟子健”等。

然而,这些姓名也成为了Google拼音的内置词汇,如:

14-a12-5.jpg

更让人浮想联翩的是,Google输入法的错误词汇和错误排序竟然和搜狗拼音输入法的错误词汇和排序位置一摸一样,如:

14-a12-10.jpg
14-a12-11.jpg
Google拼音输入法(上)和搜狗拼音输入法(下)

至此各大论坛不断新增两款输入法犯下的同样错误,用户用这种相似性不断去证明Google中国的“盗用”猜想!

搜索巨头盯上输入法

Google为什么要做拼音输入法?答案很简单,为了控制客户端。

今天,客户端结合互联网成了企业成功的标准配置,任何一个想称雄互联网的公司都在寻找一个与自己业务匹配的客户端软件。

但是在中国电脑用户中非常普及的输入法,却很少受到软件开发商的重视。虽然历史上不乏优秀的产品,比如智能狂拼、拼音加加、紫光拼音等产品,但实际上输入法市场长期被压抑,许多产品因缺乏商业模式开发处于半停滞状态。

而这次,Google选择了拼音输入法作为本土化的重要一环。目前输入法软件市场并没有形成垄断,Google如果成功占领该领域,那么将对Google本地化带来不可估量的好处。

输入法同时还可以作为搜索引擎的入口,增强用户黏性,一旦某个搜索公司的输入法占领桌面,也将为其搜索引擎带来流量。同时通过输入法对词频的统计,将结果反馈到服务器端,那么搜索厂商可以更好地对热门关键词加以掌控。

然而在Google发布输入法后,发生的词库“抄袭”风波却拴住了想要施展拳脚的Google拼音。

词库版权大争论

互联网著名律师于国富认为,词汇本身没有版权,但通过技术手段或者标准对它们进行排序组合形成一个软件的词库部分,软件版权方享有该词库的权利。比如单个文字没有版权,但是你把它写成诗歌或者散文后,就有版权了。

于国富指出,如果Google拼音是利用自己的搜索引擎技术生成了词库,则不可能有对方开发人员的姓名,因为这些生僻的姓名不能到达搜索的靠前位置。

搜狗的一位技术人员告诉记者:“词库是需要算法过滤生成的。不同的算法之间的错误偶合度应该非常低,每种算法都有自己的特性,如此大规模的错误重复属于小概率事件。”

在本报官方网站(www.cpcw.com)进行的一次调查中显示,虽然80%的用户并不关心词库是否存在抄袭,但却表示这件事情对Google在中国的形象肯定会有很大影响。

对于“抄袭”搜狗词库的流言,Google公关部的发言人一直未发表任何声明,这更为此事增加了一点神秘感。

虽然Google高喊本土化,但是除了Google进行的一些产品汉化工作之外,并没有针对本土用户需求进行创新。

作为一家国际公司,却找两个实习生进行一个对于中文用户非常重要的输入法产品开发,Google未免把本土化看得太简单。这从侧面反映出Google对于在中国的本土化并不太重视。

倘若Google再不及时汲取教训,那么以前许多国外互联网公司中国本土化失败的阴影将再次笼罩在Google的头上。