機器可讀取的科學論文
隨著人工智慧技術的進步,我們可以想像,它可以消化掉我們提供的任何訊息,但是對於科學知識來說實際上這不是那麼的簡單。長期以來,科學知識一直以大量的敘述文字的方式在不同學科、領域和學術出版物中累積。但是直到 AI 技術“學會”如何解釋複雜的科學文獻、評估其背後的資料、方法和證據之前,我們有責任確保今天我們所知道的東西能夠在最適宜的情況下供應給電腦演算法。這是 Knowledge Pixels 最近創立的一個新創公司,它正在開發軟體和服務,旨在透過聰明的方式將科學發現以人類可以理解的方式發布出來,同時也可以提供給計算機演算法來顯示、挖掘和使用的格式。這樣,精確的陳述形式的訊息將會在幾乎瞬間內傳遞到正確的人/和/或機器。
FAIR 原則與 Nanopublications
為實現以上目標,Knowledge Pixels 與 Pensoft 和 IOS Press 等具前瞻性的學術出版商合作,發起了一個旨在以同時讓人和機器都可以理解的方式發布科學發現的框架。這些合作夥伴都有一個共同的願景和使命,即建立 FAIR 原則,確保科學研究成果可找到,可存取,可互操作和可重複使用。簡單地說,你可以在網上幾個點選就能找到一份 FAIR 型的出版物,同時計算機演算法也可以進行資料挖掘。
學術界已經討論了有關以 FAIR 的方式分享科學發現的問題已經有一段時間了,但是這樣的發布流程卻尚未見白日。Knowledge Pixels 的創始人 Philipp von Essen 和 Tobias Kuhn 說,“科學的執行方式隨著數位化、網際網路和資料屬性的大幅增加發生了劇變,但是結果仍然像 300 年前的時候一樣,以敘述文字的形式進行分享。這些敍述不夠精確,機器無法直接解讀,因此也並不 FAIR。即使是最新的令人印象深刻的人工智慧工具,例如 ChatGPT 仍然只能猜測(有時候也是“幻覺”)作者的含義以及結果之間的比較。"
雖然說科學界一直在強調使用 FAIR 發布流程,但 Philipp von Essen 解釋說:“我們以 Nanopublications 作為我們的核心技術。Nanopublications 的概念基礎在 10 年前已經奠定了,當時 Semantic Web 曾經風靡一時。但事實證實,技術實現起來並不簡單,公式需要進一步的發展。只有少數研究人員繼續追求這些思想,並繼續在原型上研究。Tobias Kuhn 就是其中的一位,現在我們準備把 Nanopublications 應用到科學實踐中。”
Nanopublications 是什麼?
Nanopublications 是一個非常簡單的狹義結構形式,將一個科學發現表示為主觀者(正確性提供者或獨立取證者)的提示、陳述、證據和結論。這些陳述可以直接用一個 URI 繫結到其他提示、陳述和證據、文字上下文、資料和標識訊息,這使得其他機器和人員可以非常容易地把它們整合到他們的新知識專案中。
與研究論文相比,Nanopublications 是一個非常簡短的、基於事實的理解。這種狹義結構形式可以讓機器能夠非常容易地理解需要自動處理的部分。同時也提供了標識,從而讓人類理解是否應該信任提示。Nanopublications 是一個研究領域中最基本的單元,它可以被人或機器直接消費或擴充套件,構成更大的知識元素。
Pensoft 和 IOS Press 是如何實踐 FAIR 的?
這幾年來,科學界曾多次討論如何使用 FAIR 的方式分享科學發現的問題,但至今仍未實踐起來。然而擁有向 Web Semantics、The Semantic Web Journal 和經濟計算的出版界開了先河的出版公司 Pensoft 以及擁有大量的電腦科學出版物的出版公司 IOS Press 想方設法實踐 FAIR 原則,實驗商業模式,最終成功得以實行。這些公司從早期開始便認識到開放科學和資料標準的價值,並且不斷地推動和引導行業進行初步實驗,也著力於重點成果上。 Knowledge Pixels 提供了與這些出版商合作發布科學發現的框架。
Pensoft 和 IOS Press 正式合作的計劃是一系列的取證專案,涉及到與 Data Science 和 Research Ideas and Outcomes(RIO Journal)等創新期刊的合作,這些期刊爲科學家提供了釋出 Nanopublications 的機會。 在現有的 Data Science 和 Research Ideas and Outcomes(RIO Journal)的流程中,作者可以在 Nanodash 工具連結上填寫他們的 nanopublications。作者可以用輕鬆的方式表達他們的發現,並且不需要具備程式設計技能。
總之這是一個重大的發展,它使科學家可以將他們的研究成果以 Nanopublications 的形式發表,這些成果可在網上幾個點選內找到,可被人和機器都理解,也可被其他科學家評估和評論。
結論:FAIR 原則和機器學習的優勢
這項旨在將科學發現以 Nanopublications 的形式發布並符合 FAIR 原則的創新實驗,不僅回答了科學家長期以來提出的幾個問題,也尖端地呈現了關於如何更好地協作和交流科學問題的未來形式。隨著科學界在數位化、網際網路和大資料方面的飛速發展,FAIR 原則和機器學習技術在科學出版和研究領域中的應用將成為一個新的趨勢,將使科學家們可以更好地發揮他們的
延伸閱讀
- 本週人工智慧大事記:生成式人工智慧與創作者補償的問題
- 創業戰場 200 正式啟動!距離提名截止只剩 1 個月
- AI 新創點子解決創辦人個資外洩的痛 - 這位創辦人深受影響後的啟發
- 特斯拉的熱鬧一周:金融科技迎來了時刻?
- 微軟和 Quantinuum 或帶領量子計算的下一個時代
- 在巨型公司中創新的挑戰以及今年他感到興奮的事情 Sundar Pichai 談創新大公司的挑戰以及他今年的期待
- 思瑪 AI 獲得 7000 萬美元融資,將推出多模式 GenAI 晶片
- 科技新創週報:盛極必衰
- 兔子創業者 Jesse Lyu 談初創企業的本質:「成長快,或死得更快」,只要不放棄
- 投給代表性不足創辦人的風險資金數量更新 - 技術新聞網