人工智慧如何改善博物館的收藏檔案
圖片來源:https://www.smithsonianmag.com/smithsonian-institution/how-artificial-intelligence-could-revolutionize-museum-research-180967065/ |
生物多樣性數據雜誌(Biodiversity Data Journal)出版的一篇文章中,談到機器學習的創新案例,應用在自然史博物館(Natural History Museum)的國家植物標本館(National Herbarium)中。
這篇文章證明了數據神經網絡能夠區分兩個類似的植物家族,而且準確率超過90%,該研究使用的演算法為深度學習,演算法已經可以使用與人類專家完全相同的方式去累積經驗,因此每次運行時都會提高其性能及準確度,而這種技術可以將來自世界各地的數百萬個數據進行比較分析,以彌補人力不可及的大數據分析。
這項新的研究結果建立在史密森學會的工作基礎上,系統會將館藏數據化,並且以線上的方式進行學術和公眾的訪談,此研究也是一個跨學科的突破,植物學家、數據化專家、數據科學家、博物館學專家等專家們都在這些研究中發揮各自的作用。
標本的圖像與黏貼旁邊的ID標籤 圖片來源:https://www.smithsonianmag.com/smithsonian-institution/how-artificial-intelligence-could-revolutionize-museum-research-180967065/ |
2015年自然史博物館就安裝了攝影機和傳送帶設備,應用於植物收藏的數據化系統,減少了人工手動掃描倉庫中每塊的植物標本,不僅加快對於收藏品的盤點速度,也將博物館內500萬個標本完整的上線,每個標本也都附上完整的識別卡,卡片的內容也轉成數位檔案,與數據圖像一起上線,這項系統的改善,將博物館大量的館藏樣本數據上線,博物館藉此提供了一個更完整且全面的觀點,而對標本項目有興趣的觀眾也可以更深入的進行搜索。
本次的研究由植物學家和數據科學家所帶領的九人專家小組,旨在於回答有關機器學習和植物標本館的兩大類型問題。
阿諾德植物園 圖片來源:https://www.smithsonianmag.com/smithsonian-institution/how-artificial-intelligence-could-revolutionize-museum-research-180967065/ |
專家小組首先挑選8000份乾淨的樣本及8000染色過的樣本,用於培訓和測試計算機,當他們完成了神經網絡的訓練後,再讓訓練過的神經網絡從無污染的樣本中分選出有受到汞污染的樣本。
這樣深度的機器學習可以快速的幫助植物學家和其他科學家避免浪費時間在繁瑣的分類事物上,人工智慧解決的不是人類無法確定或做到的事,它解決的是當樣本數量龐大時,手動測試與分類需耗費大量的人力,機器學習與大數據分析為博物館提供了搜集資料的新途徑。
文:謝明惠
沒有留言: