AI 與新標準承諾透過重複使用和提供存取功能，使科學資料更有用

AI 和新標準承諾使科學資料更有用，更可重複使用和存取引言科學的進展和知識的擴充套件依賴於大量的資料。從科學家執行實驗到社會科學家進行調查，再到人文學者分析文字，每一項研究都會產生資料。沒有資料，我們就沒有詹姆斯·韋伯太空望遠鏡令人驚嘆的影象，也沒有預防疾病的疫苗，更沒有追溯所有生命譜系的演化樹。因 .... (往下繼續閱讀)

by 江塵
2023/8/23
9 分鐘閱讀時間

A- A A+

文章目錄

AI 和新標準承諾使科學資料更有用，更可重複使用和存取

引言

科學的進展和知識的擴充套件依賴於大量的資料。從科學家執行實驗到社會科學家進行調查，再到人文學者分析文字，每一項研究都會產生資料。沒有資料，我們就沒有詹姆斯·韋伯太空望遠鏡令人驚嘆的影象，也沒有預防疾病的疫苗，更沒有追溯所有生命譜系的演化樹。因此科學家們需要有效地管理這些資料，以便他們能夠再現結果、進行研究和獲取新知識。

資料管理的重要性

為了促進科學的進步，科學家需要能夠再現他人的資料或從多個來源結合資料來獲取新知識。這種共享需要良好的資料管理。就像你的鄰居需要借用一個工具或一種調料一樣，你必須知道自己是否擁有以及放在哪裡。研究資料可能儲存在研究生的膝上型電腦中，或者儲存在教授的 USB 裝置中，或者更永久地儲存線上上資料庫中。研究資料管理是一個專注於資料發現和重複使用的學科領域。這包括研究資料服務、資源和網路基礎設施。例如，資料庫是一種基礎設施，它為研究人員提供了一個將資料儲存長期的地方，以便其他人可以找到它。因此研究資料管理涵蓋了資料的整個生命周期，從產生到儲存再到下一項研究的再利用。

利用人工智慧使資料管理智慧化

許多新的研究資料管理標準來自於人工智慧（AI）的應用，包括機器學習在資料驅動領域的應用。人工智慧使資料具備了機器可操作性，也就是說，機器可以在不需要人的介入下使用這些資料。現在學者不僅可以將機器視為工具，還可以將其視為潛在的自主資料重複使用者和協作者。實現資料機器可操作性的關鍵是後設資料。後設資料是科學家為資料設定的描述，可能包括建立者、日期、覆蓋範圍和主題等元素。最低限度的後設資料幾乎沒有用處，但正確且完整的標準化後設資料能夠使資料對人和機器更有用。研究資料管理人員和圖書館員等訊息專業人員透過確保共享資料的質量、完整性和一致性，促進了科學家和系統之間的溝通。FAIR 資料原則是由名為 FORCE11 的一組研究人員於 2016 年制定的，被全球廣泛使用，它提供了如何使資料對機器和人具有重複使用價值的指導。FAIR 資料是指可發現、可存取、可互操作和可重複使用的資料，這意味著它具有強大且完整的後設資料。

AI 在資料管理中的應用

我的研究過程中，我發現，科學家們在尋找資料時往往會使用心理快捷方式，例如他們會回頭參考熟悉且可信的來源，或者搜尋他們以前使用過的特定關鍵詞。理想情況下，我們的團隊可以根據專家的決策過程，消除盡可能多的偏見，以改進人工智慧。這種自動化的心理快捷方式應該可以減少尋找合適資料這一耗時的工作。然而 AI 無法代替的一方面是資料管理計劃。資料管理計劃描述了研究資料的管理方式，包括資料的什麼、在哪裡、何時、為什麼以及由誰管理。科學家填寫這些計劃，並在研究結束後制定管理研究資料的角色和活動。這些計劃回答了一些問題，例如「誰負責長期儲存」、「資料將存放在哪裡」、「如何確保資料的安全性」和「誰支付相關費用」。幾乎所有國際和國家的資助機構的資助申請都要求提交資料管理計劃。這些計劃向科學家們傳達了他們的資料對科學界來說是有價值且重要的，值得分享。此外這些計劃幫助資助機構監控研究並調查任何可能的不當行為。但最重要的是，這些計劃有助於科學家確保他們的資料在很多年後仍然可以被使用。

社論

資料的重要性

科學資料在現代科學中起著關鍵的作用，它們是科學研究的基礎。沒有資料，科學進步將無法實現，無法達到對世界的深入理解。因此科學家們需要確保他們的資料能夠被重複使用和存取。好的資料管理不僅有助於科學家再現結果和進行新的研究，還能節省時間和資源。並且，將資料作為公共資源和共享財富，可以促進科學界的合作和發展。

AI 的應用和發展

人工智慧技術在資料管理方面的應用為科學家們提供了更多的可能性。AI 可以幫助科學家們更輕鬆地找到和存取資料，從而提高科學研究的效率和準確性。AI 還可以幫助科學家們分析和理解大量的資料，從而發現新的模式和聯動性。這使得科學家們能夠更好地回答研究問題和解決現實生活中的問題。

面臨的挑戰

然而 AI 在資料管理中還面臨著一些挑戰。首先確保資料的質量和完整性是一個重要問題。良好的資料質量可以確保科學家們在進行研究時使用到的資料是可靠和準確的。其次保護資料的隱私和安全是一個關鍵問題。在資料管理中使用 AI 可能涉及到大量的個人資料，因此需要確保這些資料的隱私和安全性，以防止濫用和侵犯個人隱私。此外資料的文化和政策問題也需要關注。不同國家和地區的資料管理政策和文化可能存在差異，這需要在資料管理的過程中加以考慮和解決。

結論和建議

綜上所述，資料管理對於科學的發展和進步至關重要。AI 的應用和發展為科學家們提供了更多的便利和可能性。然而我們也需要關注資料質量、隱私和安全等問題。為了實現資料的最大價值和重複使用，我們需要加固國際和國內的合作和交流，制定統一的資料標準和政策。此外我們還需要加固對科學家和資料管理人員的培訓，以提高其對資料管理的意識和能力。這樣才能確保資料得到恰當的管理，並為科學研究的進展提供更好的支援。注意：本文內容轉載自 The Conversation，經編輯過來自 Science X 的編輯程式的審核，並確保了內容的可信性。本文僅用於訊息目的，不構成投資建議或其他專業意見。原文連結：https://techxplore.com/news/2023-08-ai-standards-scientific-reusable-accessible.html

科學資料分析-AI,新標準,重複使用,存取功能,科學資料

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集