2007/3/5

Google的圖書搜尋發佈

Google 黑板报 -- Google 中国的博客网志
Google 圖書搜尋

雖然我們不是搜尋引擎報導的BLOG,
但是針對這項偉大的整合我們相當樂觀報給大家知道。

今天,谷歌圖書搜索中文試用版上線了。Google 圖書搜索語言種類因此增加到8個,
這也是谷歌圖書搜索在中國的開始。


這是一款提供全文檢索的圖書搜索產品,中文使用者即使在不明確目標書籍是哪本的情況下,也可以通過輸入某些關鍵字,找到和這些關鍵字匹配的圖書並購買。

在傳統的圖書館式書籍內容登記與查詢方式中,圖書管理員通過對書的內容進行摘要登記,然後把這摘要輸入成為電腦可識別的資料,因此可被搜索的圖書其實只是人工作出的摘要部分;谷歌圖書搜索與此最大的不同之處是,它對收錄的全書每一內容頁進行掃描,並通過 OCR 技術 把掃描的圖像轉換成可搜索的文字內容。這個數位化轉換過程,使塵封的經典書籍不再因為時間、地理限制而堆積在難以找尋的物理庫存中。讀者們將可以看到字字句句印在書中的原貌,出版商們的所有書目也因此擁有了一個永不下架的展示廳。

目前穀歌全球的多語言圖書搜索已包括共一百多萬本書籍。在中國,這個任務才剛剛開始, 我們還有很長的路要走。在今天的圖書搜索中文試用版中,人們能看到的書籍數量還比較有限,有不少書還在被緊張掃描中。目前古典國學類的書籍收錄相對豐富一些;而中文現代書籍的收錄,則還要期待更多出版商的參與。

0 意見: