隨著機器學習技術發展,使用機器學習的門檻漸漸降低,Lobe在今年5月時,發表了深度學習介面視覺化工具,讓沒有機器學習知識技術基礎的開發人員,不需要撰寫任何程式碼,只要透過介面拖拉點擊等操作,就能為應用程式加入圖像或是聲音辨識等功能。

EZDL則是一個與Lobe服務相似的機器學習服務平臺,也能讓使用者可以透過拖放等介面操作,自定義機器學習模型,現在提供圖像以及聲音辨識服務。

百度EZDL技術負責人謝永康表示,即使沒有接觸過程式開發的使用者,也能在EZDL平臺上沒有障礙的建立機器學習模型,而這對於資源有限的中小型企業來說特別有幫助,在缺少人工智慧專家或是運算資源的情況下,只要有資料,仍然有辦法完成深度學習模型訓練與應用部署。

EZDL主打4大特點,簡單、快速、高效能以及安全。訓練機器學習總共只需要4個步驟,從初始模型開始,接著上傳標籤資料諸如影像或是聲音物件,第三步訓練並測試模型,最後輸出模型。百度強調,他們最佳化過的演算法,平均15分鐘就能完成訓練,而且三分之二的模型,其正確率超過90%,而他們的用戶資料不只加密且隔離,並且有完備的授權機制控管。

訓練完成的模型,使用者可以選擇發布成雲端API或是離線SDK兩種方法。百度提供雲端API使用者企業級的雲端服務,具有毫秒回應時間,還能應付高並行的存取流量,保證99%可靠性。而離線使用者可以選擇將模型輸出成客戶端的SDK,支援離線在作業系統執行,甚至是iOS與Android中運作,能結合行動裝置、照相機與其他終端裝置使用。

EZDL官網給出了使用範例以及數據指標,一般影像分類,對影像中的物件或是場景進行分類,在影像中只有一個物件或是場景時使用,訓練約需要20到100張照片,每張照片都需要有標籤,整體訓練時間約為10分鐘。另外,在物件偵測的案例上,識別圖像中多個目標物件的位置、標籤以及數量,適用於圖像中有多個物件,同樣需要20到100張具有標籤的圖像,訓練時間將會超過30分鐘。而在聲音辨識上,用來辨識各種動物的聲音或是安全監控,最少需要超過50個標籤音訊檔案,一千個音訊檔案集約需要1小時的訓練時間。

製作標籤資料是機器學習的困難之一,但目前EZDL不支援多臺電腦同時使用同一個帳戶上傳資料,但使用者如有已經標記好的訓練影像,可以直接與百度連絡,申請直接上傳服務。另外,即便模型訓練完成,在往後的任何使用階段,也可以持續的進行模型最佳化。

官方介紹影片:

 


Advertisement

更多 iThome相關內容