中商情報網訊:數據標注是對未經處理的語音、圖片、文本、視頻等數據進行轉義、打點、拉線、拉框等操作,將這些數據標注為電腦可以識別的信息,然后上傳到數據庫,以供人工智能使用。隨著人工智能技術的不斷進步和應用場景的拓展,數據標注產業(yè)將迎來更加廣闊的發(fā)展空間和市場機遇。
一、數據標注的定義
數據標注,也被稱為數據標定、數據注釋,是指對文本、圖像、語音、視頻等待標注數據進行歸類、整理、編輯、糾錯、標記和批注等操作,為機器學習和人工智能算法提供訓練樣本。由于數據的質量和數量直接影響大模型的智能水平,因此數據標注也被視作人工智能的基石。數據標注的方法和類型多種多樣,包括但不限于以下幾種:
資料來源:中商產業(yè)研究院整理
二、數據標注行業(yè)發(fā)展政策
數據標注產業(yè)是對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等加工處理的新興產業(yè)。培育壯大數據標注產業(yè)對于提升數據供給質量,推動人工智能創(chuàng)新發(fā)展具有重要支撐作用。為促進數據標注產業(yè)高質量發(fā)展,發(fā)展改革委等四部門發(fā)布了《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》,提出到2027年,數據標注產業(yè)規(guī)模大幅躍升,培育一批具有影響力的科技型數據標注企業(yè),形成相對完善的數據標注產業(yè)生態(tài)。
資料來源:中商產業(yè)研究院整理
如發(fā)現本站文章存在版權問題,煩請聯(lián)系editor@askci.com我們將及時溝通與處理。