第九章 无情的图书馆

每人有信仰,且每人依赖有所信仰一实,支持身的存在。

——弗兰克·扎帕

有几分无情,你就无法创建世界最的图书馆。了在亚历山建立图书馆,托勒密王朝收在亚历山进港船现的所有书卷,摹本给书的主人。他派使者中海沿岸、中东印度搜集文献,或买或盗。据传说,托勒密二世从色列的所有12部落引进了犹太者,将《摩西五经》译本的首选语言——希腊语。者认,由此形的《七十士译本》了早期基督教徒解读《圣经旧约》的基础。图书馆甚至收藏了烹饪类书籍。托勒密王朝试图收集所找的各图书的最老版本,从理论说,些版本较少因抄写错误世校订错。

,希腊人坚持保存最老版本。公元前330年左右,雅典官员不安现,演员正在篡改埃斯库罗斯、索福克勒斯欧庇德斯的品,三位已世了至少半世纪,他被雅典人认是有史最伟的。所些品的官方版本——尽接近判定的原著——被政府档案局保管,并了法律规定,求演员忠实正确的版本。

约100年,托勒密三世决定让亚历山图书馆收藏希腊剧的官方版本,所他请求借阅便抄写。了确保归,希腊人让他支付了巨额押金,相今的数百万元。但是托勒密收藏巨著的贪婪超了金钱。他送回了复制版本,图书馆留了原版并放弃了押金。

在2008年10月前是有史最的一笔图书馆罚金,谷歌与图书版商达了一协议。从在斯坦福获数字图书馆倡议的资助,拉谢尔盖一直建立一电子图书馆。理念在他创立谷歌致力网络搜索暂被搁置了,但从未被放弃。互联网并未拥有世界所有的信息,1995年前几乎有创建的任何文本。但图书馆实体却收藏了千百年所产生的丰富信息。图书馆显是搜寻图书的源头所在,因95%的刊印图书现在已绝版。那些最的图书馆花费数十年甚至数百年经营其图书收藏,在它的藏书中,约有75%的图书不再刊印,其中一些非常古老。谢尔盖拉希望像托勒密族那接近一宝藏。2002年,实现梦的计划始形。

他必须面的一问题是何将图书变数字格式。他不知长间才世界所有的图书扫描并且数字化。所拉决定先扫描一本书搞清楚。他任产品经理的玛丽莎·梅耶一架照相机、一本300页的书一节拍器带了他的办公室。玛丽莎翻书页,同拉每一页拍照,利节拍器掌握间。他花了40分钟,扫描了所有300页内容。

拉一团队始走访其他图书数字化项目,包括他读本科的母校密歇根的一项目。他在那了解,该校估计将其全部700万册藏书数字化所需的间是1000年。他告诉密歇根校长玛丽·苏·科尔曼,谷歌在6年内完。

他做了一的软件公司说是不寻常的举动,雇机器人工程师研制替代玛丽莎、拉节拍器的机器人翻页机扫描仪。其他公司研制的此类装置在市场已经存在,但拉认谷歌的优秀团队做更,他设计了一动非常轻柔的装置,处理较老图书的脆弱页面。谷歌的软件编程人员创建了一页面识别软件程序,识别超长类型尺寸的图书430不同语言的罕见字体。

,该团队始访问型图书馆,讨论他的计划。在牛津图书馆,他检查了那些有数百年历史的图书,些书被精保存,很少拿,仅有资格的者借。谷歌团队热情洋溢谈,将些书数字化,使所有人利。经一年的讨论,牛津最终“谷歌印刷品”(重新命名“谷歌图书搜索”)倡议的首位合伙伴,并与谷歌达了一协议,在三年内将其100余万册19世纪的藏书数字化。

版商的窘境

部分工很简单。拥有200年历史的图书已不再受版权保护。但拉需较近代的图书,一些是印刷品,一些不是。此,他需了解版业务的人提供帮助。他找了一位在兰登书屋工的年轻人,名叫亚·史密斯(Adam Smith)。

史密斯并非你常见的那谷歌怪才。他高高的子,30岁光景,体格健壮、身材修长,头修剪一丝不乱,在我遇见他的那非常健谈,流露功人士的信微笑,俨一副他曾经担任的版业年轻高管的春风意的子。2003年,史密斯在《纽约报》写了一篇关兰登书屋走向数字化颇感兴趣的文章。篇文章引了谷歌伙子的注意。年8月,他同意拉、公司顾问戴维·德拉蒙德广告主管苏珊·沃西基见面,他准备在几赶纽约。并非一次求职面试,但是加州人史密斯希望此。“我在,是我回加州的机票。”他说。

次见面未约进行。几位谷歌人在纽约的露面,简直令曼哈顿停摆。谷歌在2003年11月召见史密斯进行了正式面试。那他终见了拉。

像往常一,次见更像是一次信息倾泻,不是一次面试。“拉版业、它的运他的动力感奇。他知他的推动力他的兴趣点。他很一我所谓的‘解决问题’的方法洞察一行业。他说:‘版商一定有难题,那我他做些什?是一庞的产业,互联网准备在其中挥某。所从产品的角度,谷歌应该何待一点?’”

史密斯的回答给拉留了深刻的印象,至将其雇。2003年12月,史密斯正式加入谷歌。一年,谷歌宣布了它所结的伙伴关系,它将5座图书馆——哈佛、密歇根、牛津、斯坦福纽约公共图书馆——的图书数字化。在每伙伴关系,谷歌将支付所有费。实现他建立世界最图书馆的宿愿,一点非常重。“从斯坦福代,拉谢尔盖就一直未放弃他将图书数字化的梦。”史密斯说。

计划宣布,一间争议四。法国国图书馆的官员立即抱怨说面存在偏见。正亚历山图书馆极度偏爱希腊书卷,法国人抱怨谷歌的数字化方案偏向英语语言类图书。争议的平息相比较简单。首席执行官施密特前往巴黎解释项计划,谷歌将项业务扩展外国图书馆。从一始就是拉的意图,他的目标显托勒密一世的目标一雄勃勃。“我需世界所有的书籍,每一语言的,”史密斯说,“且我希望够全文搜索所有图书。”

初,他认将图书数字化的法很容易认同。首先,所有版商在关注着纸质文字走向数字化,争着抢着设法加入一演变程。“行业正在实施其一波电子图书战略,”史密斯回忆,“他并未获一直期望的动力。设备留给他己,他否向公众提供电子图书,一点尚不清楚。”

史密斯他的团队现了一类敏锐的受众。他见了主版商,向他提供了与图书馆相同的合约:版商供应图书,谷歌将其数字化,它放网,向公众提供图书的简短摘,并提供网站链接,感兴趣的读者那些网站购买图书。谷歌将支付所有费,甚至不收取任何买方参考费,尽管版商像其他广告客户那,在显示文本旁边做广告,支付竞价点击费。在图书受版权保护的情形,人全篇搜索现某条信息,但是谷歌每次将提供全文的简短片段。提求的版商,图书访问将进一步受限,将每月提供的文字量限定全书的20%。

谷歌声称,做版商的主处是加强所售图书的简单介绍。数人不愿意在网阅读整本书,果他现一本书十分有趣,他宁愿购买便阅读的纸质版本。史密斯说,谷歌的方法是提供一“类似走进书店翻阅图书的体验”。

他现,每版社有人拥护谷歌的法。其中数人表示赞同,一些人则不确定,方案实施情况再说。有人提供免费访问图书的机将促人购买的观点存疑虑。

谷歌将一方案提供给有书卖的任何人。者将供搜索的品扫描件在其博客布,并链接至亚马逊网站,每次有人点击亚马逊链接购买图书,他从亚马逊网站拿10%~15%的回扣。

方案已经取了功。今,它已经将约700万册图书数字化并予布。史密斯说,谷歌已经现,人浏览的书页越,最越有购买整本书。

碰撞

(本章未完)

第八章 如何保护用户隐私?目录+书签-->