字體:小 中 大 | |
|
|
2012/12/27 04:23:32瀏覽465|回應0|推薦1 | |
2012.12.7 百道新出版研究院/Lein de Leon;楊茜雯編譯 數位出版時代,專業出版也不甘落後,資料庫也開始玩起了新花樣。以Medeley為代表的專業的資料庫開發商強勢進入市場,著力為研究學者們提供更為豐富的內容資源和更為便捷的搜索工具。 學者們紛紛開始透過不同的方式查找學術論文,Siân Harris對傳統的摘要與索引(A&I)資料庫和潛在的行業「破壞者」進行了調研。 摘要與索引資料庫很多年以來都在搜索學術資料上發揮了非常重要的作用。起初,這些索引是設限的,而且以印刷版為基礎,但是這些資訊很好地利用了這一平臺,早早出現在了網路上。 隨著線上內容規模的擴大,再加上資料物件標識的廣泛運用。這類資料庫同時還成為了直接獲得相關文章的始發點。 業內的一些重量級玩家在提供可信度高、以訂閱為基礎的文獻目錄資訊、鏈結以及最近剛剛興起的引用資訊方面都有著不凡的表現。 「學術資料庫的一個關鍵的角色是,它還是世界上重要研究的目錄匯總,」路透社的「知識資料庫」產品與市場策略副總克里斯.柏戈特(Chris Burghardt)如是說。 「最初的觸發者是研究者們;這一目錄幫助他們理解研究的背景,這樣他們就可以更快地開展手頭上的專案,」他說。 「科學網是市場上非常特殊的一種資料庫。它並不包含世界範圍內所有的期刊——大概只有12%的期刊被收錄,」他繼續介紹說,在資料庫中的12,000種雜誌裡,前300種就涵蓋了50%的頂尖研究領域。憑藉這些期刊,科學網提供了範圍廣、有深度的資訊,最早的資料來源甚至可以追溯到上個世紀初。「我們認為科學網的好處就在於可以幫助研究人員們找到新穎的研究成果並保證我們可提供的搜索結果是充分可信的。 然而,據柏戈特觀察,像科學網這樣的資料庫不僅僅只是獲取資料的工具。事實上,「知識資料庫」還包括14種其他的資料庫,目標在於形成一個「引用宇宙」,容納更多、更廣、更深的領域的資訊資料。「知識資料庫」提供的是一個區域性的資料庫,如中國科學引文資料庫。近期他們還在巴西簽訂了最新合約,把當地的「科學電子圖書線上」(the Scientific Electronic Library Online)納入了「知識資料庫」。 路透社還登記註冊了其他的專門性的資料庫作為「知識資料庫」的一部分。其中一個就是工程技術學院的「科學文摘資料庫」。 「‘科學文摘資料庫’的角色定位是一個容納了工程領域廣泛課題的分類資料庫」,工程技術學院的學術出版主要負責人丹尼爾.史密斯(Daniel Smith)解釋說,「我們馬上就要達到我們的第13個破百萬的記錄,而且我們還能預見每年5%到10%的成長率。我們提供的是專業服務,因此我們並不打算和其他普通的競爭。」 潛在的破壞者 多年來,這類資料庫已經得到了廣泛的運用和重視。然而,越來越多的線上學術服務的開發和發展,以及網際網路本身的發展,為我們帶來了一些潛在的「破壞者」,與傳統的摘要與索引商業模式瓜分市場占比。 潛在破壞者的重要作用之一就是透過網路搜索引擎幫助用戶來搜索和指向學術內容的鏈結。雖然像谷歌這樣的搜索引擎不會把自己的服務範圍限於學術內容,但其搜索引擎在向研究人員提供其他相關資料的時候也已經設計得非常精細。谷歌同時也有它自己的學術搜索引擎,名為「谷歌學術搜索」(Google Scholar)。然而這項業務在公司內部看起來像是失寵了,因為在谷歌的首頁上沒有再出現「谷歌學術搜索」的直接鏈結,也有一些研究人員直言不諱地說他們會直接使用谷歌進行搜索。 「沒人會妄想自己能跟谷歌齊頭並進,」工程技術學院的史密斯說。 「這是個非常有用的工具,可以幫助我們找到有用的資料,我們不打算跟他們競爭。我們的強項在於我們的搜索是針對工程領域的用戶的。」 他還注意到,谷歌的撤回計畫並沒有針對任何特別的行動。而且此次行動只輻射線上內容。這就可能面臨史密斯所說的「睡美人」風險(這一概念在還沒有線上搜索的時候就出現了)。他說,打個比方,如彙集太陽能、早期的鐳射運用以及鋼鐵船的製造的想法都早在網路出現之前就已經出版了。 因為有品質和相關性的保證,開辦很久的訂閱式的資料庫在競爭中占上風。「沒有人真正知道什麼樣的關聯度能在谷歌的搜索排名中靠前,」史密斯表示,「而谷歌也不知道用戶究竟想用它提供的資訊來做些什麼。」 擁擠的資源和網路 一些其他的潛在的「破壞」來源於行業內兩個特點的同時作用——資源的氾濫和社群媒體的高度發達,這兩個因素對於Mendeley這一提供免費的參考資源的管理和社群媒體服務的網站來說都很關鍵。 今年夏天Mendeley首次發布其應用程式介面就獲得了每個月上千萬的容量成長,並且其包含了6,500萬種特殊的檔,有人在部落格上預測,Mendeley已經成為了最大的摘要和索引資料庫。 這對Mendeley 的創始人維克多.亨寧(Victor Henning)來說是個有雙面性的消息:「當我們開始做這件事的時候我們並沒有希望去替代現有的資料庫,即便是我們意識到我們提供的資訊都是非常有價值的。」他說。 Mendeley的主要目的是讓學者們把他們的檔案組織起來並透過社群網路和同行分享資訊。然而,很多的研究都得出相似的結論,認為因為Mendeley資料庫的容量實在是令人震驚,該資料庫覆蓋了約為97%的學術論文。 「人們可以發現研究成果並且找到和自己相關的研究。這對於那些沒有許可權進入Scopus和科學網的用戶來說實在是太有用了。」亨寧繼續說道。 那麼,傳統的資料庫公司又是怎麼看待這些潛在的「破壞者」的呢?「我們當然也會關注市面上的開發專案,谷歌學術搜索和Mendeley都是非常不錯的開發專案。」路透社的巴登維勒(Burghardt)說,「谷歌是一家非常厲害的公司,也是一個當你一無所知的時候可以查找資料的好平臺,當然,如果你非常清楚你自己想找的是什麼,你也可以在谷歌上直接敲入文章的索引號進行搜索。」 在談論Mendeley的時候,巴登維勒注意到Mendeley的搜索方法不同於傳統的資料庫。「Mendeley被嵌入到更多的研究流程中,尤其他們重點關注了年輕學者們的研究,從這一點上來說,他們的資源豐富度就非常突出。真正的問題在於如何做一個持續的長期計畫,」他說。 同樣的,印刷的問題在這裡也不能被忽略。Mendeley的內容在錄入時都是採用PDF格式的,但是許多雜誌都還是只提供印刷版。的確如工程研究學院的史密斯所注意到的那樣:「我們還是在搜索紙質內容——我們現在看到的材料中,有大約50%都是印刷版的。」他介紹說,原因一部分的原因在於地域差別造成的。打個比方,在俄羅斯,還是強調印刷為主的。 提高品質 關於紀錄的問題,也還是存在品質標準的。要想豐富Mendeley資料庫的內容,公司就必須和許多出版商合作,來添加平臺上現有文章的相關資訊。根據亨寧透露,這些合作夥伴中包括斯普林格、電氣和電子工程師協會以及徳古意特。雖然這是個耗時的過程,但是很有用,因為Mendeley的內容本身已經是有豐富的來源的,而人們大多傾向於添加與自己相關的細節——而這通常會將摘要和數位物件標識排除在外。消除資訊歧義也是Mendeley和其他所有引用不同來源資訊的平臺要面臨的一個重要挑戰。資料庫提供商都非常樂觀地認為這一領域的內容品質和相關性都會隨著今年底ORCID(一種用於消解作者署名歧義的工具)的出現而有所提高。 「研究的全球性帶來的主要挑戰在於,很多人的名或者姓都很相似。」路透社的巴登維勒介紹說,這就給授權帶來了一定的困難。「自動鑑別可能發生的作用很有限。而我認為這個行業可以和ORCID有所合作是件可喜可賀的事情。」 要想在網上找到文獻目錄資訊的方法有很多種。而可以使用的工具也是時時在變化的。打個比方,工程技術學院正在努力把科學文摘資料庫和專利搜索工具關聯起來,以幫助識別先前的技術。而路透社則正在計畫在今年底推出資料引文索引工具。 至少就現階段來說,不同的工具之間存在相互補充性,並且在研究的過程中發揮不同的作用。但是,正如工程技術學院的史密斯所說,他們還是需要記住一個關鍵的指導思想——「人們使用搜索工具的目的不是為了搜索而搜索,他們是希望找到對自己有用的東西。」 |
|
( 知識學習|其他 ) |