臺灣新創Frontier除了利用AWS辨識模型來判斷布片花色、自動貼標外,也融合了臺科大的智慧影像辨識模型,甚至是醫療MR影像專用的AI技術,來強化布片辨識的精細度。

圖片來源: 

攝影/王若樸

重點新聞(0925~1001)

影像辨識     紡織     Frontier  

臺新創以16支辨識引擎打造數位布片資料庫,要當紡織界Google Search

臺灣新創Frontier主打紡織企業雲平臺,瞄準紡織業數位化痛點,以一套數位布片資料庫和內建的16支辨識引擎,來優化布片偵測、校正和分類等作業,把布片上傳流程從50分鐘縮短為3分鐘,連Zara母公司Inditex、Under Armour和全球最大的數位成衣設計公司Virtuality Fashion都愛用。

Frontier共同創辦人暨執行長趙均埔指出,紡織業工作流程要數位化,第一步就是建立布料樣本資料庫。目前,全球只有3家廠商提供布片資料庫服務,以其中的美國廠商來說,因布片上傳後,還得仰賴人工判斷、分類,因此整個布片上傳、建檔流程,就得花上50分鐘。而Frontier將平臺建於AWS上,利用AWS和其他工具來自動辨識布片、校正顏色、降噪、貼標和歸類等作業;趙均埔指出,該平臺共有16支辨識引擎,除了7支為AWS外,他們還採用北科大的智慧影像辨識技術,甚至還有醫療MRI病灶辨識技術,來強化對布片細節的偵測。此外,該平臺也透過自然語言處理API,來優化布料搜尋和詢價等功能。

他指出,有了數位布片庫,一件成衣的設計時間可從原本的45天縮短為1天,製成時間也從300天縮短為7天,也不會產生庫存。也因為該平臺提供聊天功能,趙均埔指出,文字傳遞結合布片辨識,也提升疫情期間的溝通效率。(詳全文)

  工研院     自拍無人機    辨識  

用上千張網紅照片訓練AI,工研院無人機自動捕捉最佳角度

工研院日前在年度技術日上,展示一款新研發的自拍無人機,可自動尋找最佳拍攝角度來拍照,免除過去須手動調整的不便。這款無人機所配置的辨識模型,是由上千張專業攝影師拍攝的網美照片訓練而成;工研院指出,拍攝時,AI模型會根據鏡中人的關節姿勢,比對訓練資料集中相似的照片,進而採取類似的拍攝角度和畫面裁切,自動調整飛行高度和遠近等。

工研院也表示,未來,這款無人機可協助警方於偏遠地區巡邏,從空中視角來判斷異常活動,比如夜間盜伐,再結合後臺通報系統,來即時辦案、懲處。(詳全文)

  自然語言處理   參數       pQRNN PRADO  

就算參數少300倍,Google新NLP模型也能達BERT水準

Google近日發表一項研究成果,團隊在去年打造的自然語言處理(NLP)模型PRADO基礎上,開發出pQRNN模型,可讓模型以少量參數,就能達到BERT等級的高階表現。

pQRNN PRADO由三個模組組成,分別是投射操作(Projection operation)、密集瓶頸層(Dense Bottleneck Layer),以及QRNN編碼器。投射操作可將文本中的Token轉換為三元向量,密集瓶頸層可學習與NLP任務相關的每個單字特徵,而QRNN編碼器不須預處理,就能從輸入的文本中學習上下文特徵。經測試,pQRNN PRADO參數雖比BERT少了300倍,且也未進行預訓練,就能在NLP任務表現上,達到與BERT相當的水準。隨後,Google也在GitHub上開源PRADO模型。(詳全文)

  AI平臺預測     XGBoost     機器學習模型  

Google正式推出AI平臺預測服務,要優化機器學習工作流程

Google近日發布AI平臺預測(AI Platform Prediction)正式版,開發者可用於雲端,來準備、建立、執行和共享機器學習模型。該平臺建於Google Kubernetes Engine後端,具高靈活、低延遲等特性。進一步來說,AI平臺預測讓開發者更容易部署以XGBoost、scikit等框架訓練的模型,也提供新的Compute Engine機器類型和Nvidia加速器,讓使用者依其所需來選擇。除此之外,AI平臺預測也提供模型預測的資訊和視覺化工具,來解釋模型產出預測結果的原因。AI平臺預測為完全託管、無叢集的服務,而且,要是使用者發送過多流量,Google將分配管理,以免模型過載。(詳全文)

  Google     LipSync     群眾外包  

Google發起對嘴挑戰賽,靠群眾外包來訓練AI模型

Google日前發起一場AI挑戰賽LipSync,要請使用者為一首歌對嘴,來完成Google的AI實驗。LipSync的目標,是要衡量使用者用手機或桌機對嘴的準確度。實驗會以相機拍攝用戶的臉部表情,再以瀏覽器上的Google TensorFlow.js facemesh模型,即時分析用戶嘴巴、唇部特徵點,來評估對嘴是否準確,但不會錄下任何聲音,資料也不會回傳至Google。

Google指出,這項實驗是要協助訓練AI,來了解人說話時的表情。這些知識可建立一套系統,來追蹤無法正常說話的族群,像是肌萎縮性側索硬化症(ALS,俗稱漸凍人症)患者,甚至未來能利用語音合成技術來替他們發聲。最後,Google將開放LipSync的程式碼和技術文件下載。(詳全文)

微軟    擴充套件    程式碼  

程式語言擴充套件Pylance推新功能,程式碼可讀性更高

微軟近日更新了語言伺服器擴充套件Pylance功能,新增著色和自動匯入支援等功能。Pylance是今年7月時,微軟在VS Code上新推出的Python程式語言擴充套件。

Pylance以靜態類型檢查工具Pyright為基礎,提供豐富的類型資訊,且能助開發者編寫高品質的程式碼。其中,最新的語義著色功能能以顏色突出顯示程式碼,提高整體程式碼的可讀性。再來,Pylance自動匯入完成功能也有所改進,開發者能在完成工作提示中,看到即將被添加到檔案中的匯入陳述式預覽。(詳全文)

Bing   自動詞彙建議    問答  

微軟以語言模型改進Bing自動字詞建議與相關問答功能

微軟將自家自然語言生成模型T-NLG用於Bing搜尋引擎中,來改善字詞預測,並利用自然語言表示模型T-ULR,提升多語言智慧問答的品質。首先,微軟以T-NLG模型改進Bing搜尋欄的自動建議功能,讓Bing能即時生成建議,不受限於以前使用者輸入的資料,或是當前輸入的字詞。

另外,Bing也應用自然語言表示模型T-ULR,提升多語言和多地區的搜尋結果品質,Bing智慧問答功能已可對100多種語言和200多個地區,提供零次問答服務,該模型也用來突顯搜尋結果的摘要重點,讓用戶能夠更快地找到需要的答案。(詳全文)

Adobe     PDF      液態模式  

小螢幕不用怕,Adobe釋出AI工具來自動調整PDF畫面

有鑒於愈來愈多人在手機上處理公事或讀文件,Adobe也為PC時代產生的Adobe Acrobat加入液態模式(Liquid Mode)新功能,透過將檔案送到Adobe Document Cloud處理,轉換為合適的大小,方便用戶在小螢幕裝置查詢、閱覽PDF文件。

當使用者開啟PDF文件時,液態模式的AI會分析文件結構,包括標題、段落、圖片、清單列表或表格,並依螢幕大小重新排版,以便在小螢幕裝置上讀取。(詳全文)

 

 

圖片來源/Google、微軟、Bing、Adobe

攝影/王若樸

 AI趨勢近期新聞 

1. 全臺第一支警用無人機隊成軍!新北市警鎖定刑事、環境交通和防救災

2. 臉書發布AI動態基準測試平臺Dynabench

3. 臺北市自駕巴士測試進入新階段,即日起開放民眾預約試乘

資料來源:iThome整理,2020年10月

 
 
 
 


Advertisement

更多 iThome相關內容