慧安小課堂 | 靈境-圖像管理與數據質檢



靈境慧安蜂巢算法中臺是慧安蜂巢智能支撐產品之一,全面支持數據集管理、算法開發(fā)、模型訓練、在線部署等算法全生命周期工作。本期為大家介紹靈境的圖像管理功能和數據質檢這兩個重要能力。
圖像管理
除了醫(yī)療圖像領域,數字成像通信(Digital Imaging and Communications in Medicine,DCM)標準在工業(yè)上也有應用。非破壞性檢測(Non-Destructive Testing,NDT):DCM標準可以應用于非破壞性檢測領域,如金屬檢測、焊接缺陷檢測、材料缺陷檢測等。工業(yè)上的數字成像設備可以生成圖像數據,并使用DCM格式進行存儲和傳輸,以便進行后續(xù)的分析和處理。
為了滿足工業(yè)需求慧安蜂巢靈境人工智能算法中臺提供圖像管理能力,包括數據集上傳和標注。
DCM焊縫圖像
數據質檢
數據質檢(Data Quality Assurance)是指對數據集質量進行評估和驗證的過程,旨在確保數據的準確性、完整性、一致性和可靠性。數據質檢是數據管理和數據分析中非常重要的一環(huán),因為低質量的數據會導致錯誤的決策和不可靠的分析結果。
在慧安靈境算法中臺的數據集管理中加入了數據質檢的功能,利用統(tǒng)計分析和圖像處理算法對用戶上傳的數據集進行分析,生成數據質檢報告,直觀地展示數據質量情況。數據質檢報告主要包括兩方面內容。一方面是原始數據集本身的信息:數據集大小、圖片數量、圖片存儲大小分布、高寬比分布、分辨率分布、清晰度分布、色偏分布、色彩空間分布、相似度分布。另一方面是數據標注相關信息(目標檢測標注為例):標注框高寬比分布、標準框面積分布、堆疊度分布、標簽分布、標簽總數、總平均標注數(標注框總數/已標注圖片數)、已標圖像占比(已標圖片數)。如下圖所示,以圖表的形式直觀展示數據集的質量情況。
操作過程
數據質檢報告
總結
數據質檢和圖像管理功能旨在為用戶提供更完善的數據集管理工具和服務。我們將對用戶需求進行持續(xù)關注和的不斷追求技術創(chuàng)新。我們相信,通過提供數據質檢和圖像管理功能,慧安蜂巢人工智能算法中臺將助力用戶和企業(yè)智能升級。
來源 | 研發(fā)中心
審核 | 市場部