###### tags: `AI`,`2022` {%hackmd BJrTq20hE %} # 資料標註(Data Annotation) 會影響AI的輸出結果,自行開發則需要較多的開發成本,因此可以選擇合適的資料標註工具來。 ## 數據集管理(Dataset management) 標註的開始與結束,需要確保正在考慮的工具能夠實際導入並可以支持所需要標記的大量資料與文件類型,包含數據集的搜尋、過濾、排序、備份、合併,在完成收集後,導出的文件是可用的並可以依照指定格式保存資料,確保可以輸入到機器學習模型中。 ## 標註技術(Annotation methods) 資料標註工具的核心,是否提供適用於所需類型數據集的標註技術,像是文本、圖片標註、音檔標註、特定標註類型、自動化標註,可以透過工具取的所需的標註資料,並利用。 ## 數據質量控制(Data quality control) 標註的期間可以透過工具進行資料反饋與問題追蹤,許多工具提供質量的儀表板,幫助管理人員查看跟追蹤問題。 ## 勞動力管理(Workforce management) 資料標註工具也是各個項目的管理平台,可以透過平台將工作進行分配,讓團隊成員,分工合作,優化工作流程。 ## 安全性(Security) 對於收集到的數據,須遵守安全標準與協議,可控管對於註釋敏感的受保護個人訊息,如涉及個人資料的數據。而數據儲存位置和共享方面提供嚴謹的安全性,要有權限的控管機制。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up