網路議題

AI 與新標準帶來科學資料更高效運用的美好前景

人工智慧和新標準承諾使科學資料更具重用性和可存取性科學的資料取得和利用每當一位科學家進行實驗,社會科學家進行調查,或人文學者分析一段文字,他們都會產生資料。科學是建立在資料上的——沒有資料,我們就無法擁有詹姆斯·韋伯太空望遠鏡的驚人影象、預防疾病的疫苗,或能追蹤所有生命譜系的演化樹。這些研究產生了龐 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

AI 與新標準帶來科學資料更高效運用的美好前景

人工智慧和新標準承諾使科學資料更具重用性和可存取性

科學的資料取得和利用

每當一位科學家進行實驗,社會科學家進行調查,或人文學者分析一段文字,他們都會產生資料。科學是建立在資料上的——沒有資料,我們就無法擁有詹姆斯·韋伯太空望遠鏡的驚人影象、預防疾病的疫苗,或能追蹤所有生命譜系的演化樹。這些研究產生了龐大的資料量,那麼研究人員是如何跟蹤這些資料的呢?他們如何確保這些資料能夠被人類和機器使用?為了改進和推進科學,科學家需要能夠再現他人的資料,或者將來自多個來源的資料結合起來獲取新的知識。任何形式的共享都需要管理。就像當你的鄰居需要借用工具或食材時,你需要知道你是否有它以及它位於何處。研究資料可能存在於研究生的筆記本中,也可能儲存在教授的 USB 收藏中,或者更長期地儲存線上上資料儲存庫中。

研究資料管理

研究資料管理是一個關注資料發現和重用的學術領域。這個領域包括研究資料服務、資源和網路基礎設施。例如,資料儲存庫這一型別的基礎設施為研究人員提供了一個地方,可以將他們的資料儲存長期以供他人查詢。簡單來說研究資料管理包括從起源到下一項研究中資料的全生命周期。可存取和可用的資料可以幫助科學家再現以前的結果。這是科學過程中的一個重要步驟,如 TED-Ed 影片所解釋的那樣。合理的研究資料管理還使科學家能夠使用已經存在的資料,而不是重複收集已經存在的資料,從而節省時間和資源。隨著科學政治化程度的提高,許多國家和國際科學組織提高了對問責和透明的標準。現在聯邦機構和其他主要研究資助者,如美國國家衛生研究院,優先考慮研究資料管理,要求研究人員在獲得任何資金之前提供資料管理計劃。

人工智慧在資料管理中的應用

這些研究資料管理的新標準主要源於人工智慧,包括機器學習在資料驅動領域的增加應用。人工智慧使任何資料都能夠無需人工幹預而被機器使用,這使得資料的機器可用性變得非常有吸引力。現在學者們可以將機器不僅視為工具,而且視為潛在的自主資料重用者和合作夥伴。實現機器可操作的資料的關鍵是後設資料。後設資料是科學家對其資料設定的描述,可能包括建立者、日期、覆蓋範圍和主題等元素。最小的後設資料具有最小的用途,但正確和完整的標準化後設資料使資料對人和機器更有用。需要一批研究資料管理人員和圖書館員來實現可機器操作的資料。這些訊息專業人員的工作是透過確保共享資料的質量、完整性和一致性,促進科學家和系統之間的溝通。2016 年一個名為 FORCE11 的研究人員小組制定的 FAIR 資料原則在全球範圍內得到廣泛應用,該原則指導如何實現人和機器都能夠重用資料。在過去我研究了科學家是如何發現和重用資料的。我發現科學家在尋找資料時往往選擇心理方便的方式,例如回頭尋找熟悉可信的來源,或者搜尋他們以前使用過的特定關鍵詞。理想情況下,我的團隊可以建立專家的決策過程,並盡可能去除許多偏見以改善人工智慧。對這些心理快捷方式的自動化應該能夠減少查詢正確資料的耗時工作。

資料管理計劃

然而人工智慧還無法在研究資料管理的所有方面代替人類。資料管理計劃描述了如何管理研究資料的「什麼、在哪裡、何時、為什麼」以及「誰」。科學家需要填寫這些計劃,並且在研究結束後描述了管理研究資料的角色和活動。這些計劃回答了例如「誰負責長期儲存」、「資料將存放在哪裡」、「如何保護我的資料安全」以及「誰支付所有費用」等問題。幾乎所有國家的資金機構的撥款提案現在都要求提供資料管理計劃。這些計劃向科學家們表明他們的資料是有價值的,對社會來說也是足夠重要的,以至於值得共享。此外這些計劃還幫助資金機構監控研究並調查潛在的不端行為。但最重要的是,它們幫助科學家確保他們的資料在很多年後依然可以被存取和使用。讓所有研究資料都能夠成為 FAIR(可尋找、可存取、可互操作和可重用)並盡可能開放,將改善科學過程。並且,取得更多資料的存取權能夠開啟如何促進經濟發展、改善自然資源管理、提高公共衛生以及負責和道德地發展改善生活的技術的可能性。所有形式的情報,無論是人工智慧還是其他形式的智慧,都將受益於更好的組織、存取和使用研究資料的能力。

Efficiency-AI,新標準,科學資料,高效運用,美好前景

江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。