Coursera
重點新聞(0617~0623)
Coursera 資料科學 技能
Coursera公布100多國1億名學習者技能報告,臺灣資料科學熟練度僅66%、整體技能排名全球第53
由AI大師吳恩達創辦的線上學習網站Coursera,日前公布2022年全球技能報告,統計對象涵蓋100多國、1億名Coursera線上學習者,並將技能分為商務、技術、資料科學等3類。其中,資料科學技能包括機器學習、數學、統計編程、資料視覺化、資料分析、資料管理、機率與統計等6種,技術則指各種開發技能,像是行動裝置程式開發、網頁開發、軟體工程、雲端計算等,商務則是軟實力技能,如溝通、領導與管理、創業、財金等。
以亞太區的臺灣來說,今年全球整體技能排名為53,較去年掉了30名,資料科學的熟練度為66%,技術和商務技能熟練度分別是47%和32%。亞太區國家前3名則是印尼(全球第3)、新加坡(全球第5)、日本(全球第6),資料科學的熟練度分別是100%、82%和91%。
總體而言,Coursera指出,這份報告顯示了學習者對數位轉型、通貨膨脹和全球不穩定性做出的反應,更多人學習數位技能和軟實力技能,來因應未來新經濟需求。特別是在發達國家,學習變革管理和韌性課程的人越來越多,發展中國家學習者,則透過供應鏈系統、行動資訊架構等課程,來強化數位技能。(詳全文)
Line Today ML 推薦
Line Today臺灣月活躍用戶1,800多萬,解密背後ML推薦平臺工具鏈
Line從2016年開始在臺推出內容入口平臺Line Today,不只提供文字新聞,後來也提供影音、直播等內容,甚至連天氣、電影介紹和投票都包括在內。這幾年,這個內容平臺還進一步從臺灣擴展到印尼、泰國、香港等市場,目前在臺每月活躍用戶數達1,800多萬人。
該平臺所採用的工具鏈,包括將Jupyter Notebook打包的Jutopia開發環境,讓資料科學家,更方便存取收集在內部IU資料倉儲中的使用者瀏覽行為資料,好用來探索資料和開發模型。在模型運算時,團隊採用開源大數據分析工具Spark和Hive,來進行不同資料處理與運算,並利用NSML系統,來調度CPU和GPU資源。當模型準備正式上線時,團隊則採用開源排程管理工具AirFlow,來管理模型周期性訓練或周期性推論。
此外,在一般的模型開發階段,他們也利用開源機器學習平臺MLFlow,來管理不同實驗數據和指標。在正式部署階段,團隊則利用開源部署工具BentoML打包成即時工作管線,來與不同服務的介面介接。如果是批次模式,則能透過Jutopia Notebook,將模型與IU資料倉儲離線整合。(詳全文)
微軟 MLOps v2 加速器
微軟開源MLOps v2加速器計畫在7月釋出完整版
微軟近日推出Beta第2版的MLOps v2加速器,使用者可透過這個統一的解決方案,來簡化MLOps工作流程。可直接從GitHub上取得。
微軟表示,好的MLOps可加速模型從測試到正式上線的時間,還能提供跨團隊的ML元件所有權、歷史資訊管理。這款MLOps v2,可讓使用者跨多個工作區域部署端到端、標準化且可擴展的機器學習生命周期。藉由抽象化外層迴圈的基礎架構,使用者可專注開發專案的內層迴圈。在這個v2版,微軟也優化了古典機器學習、自然語言處理、電腦視覺等類型的MLOps工作流程,可更快速處理。MLOps v2完整版預計7月釋出。(詳全文)
Meta S2ST 語音轉語音
不必再多一步!Meta最新翻譯模型可直接語音轉語音
Meta最近揭露語音轉語音翻譯(S2ST)新模型,可直接將輸入語音翻譯為另一種語言的語音,不必再將輸入語音先轉為文字再輸出,等於跳過這個中間步驟。
一般來說,傳統S2ST方法是將源語語音轉為目標語語音頻譜,也就是多維度、連續值的頻率頻譜。但用語音頻譜訓練翻譯模型很麻煩,因為模型必須學習2種語言之間的關係,比如2者的聲音特徵比較、如何對齊等。因此,Meta團隊改用從自監督語音表徵中取得的離散語音單元,加上NLP技術,以近14萬對西班牙-英語電話語句來訓練S2ST模型。這個模型以Transformer為基礎,包含一個語音編碼器,以及一個合併附加任務的離散單位解碼器。他們發現,這種方法取得3種突破:模型表現比現有任何傳統方法的模型要好,而且是首個直接用真實S2ST資料訓練多語言的系統,還能用未標註的預訓練資料訓練。(詳全文)
Coursera 史丹佛大學 非監督式學習
吳恩達新版機器學習入門課程上線了
吳恩達2012年推出、擁有480萬名學習者的熱門機器學習課程,最近改版並在Coursera發布了!這次,吳恩達創辦的AI新創DeepLearning.AI與史丹佛大學線上學習部聯手,將機器學習入門課程重整為3部分,第1部分聚焦監督式機器學習:迴歸與分類,會教學習者如何用熱門的ML函式庫NumPy和scikit-learn來建ML模型,以及如何訓練模型來進行預測或二元分類任務。
第二部分則著重於進階學習演算法,學習者會學習如何用TensorFlow來建立、訓練類神經網路,並用來執行多類別分類任務,該課程也會教學習者如何建立並使用決策樹演算法。最後一部分則聚焦非監督式學習、推薦器和強化學習。(詳全文)
Chrome 103 網站通知 機器學習
一直跳通知好煩!Chrome 103將用ML封鎖網站請求
Google日前宣布,新版Chrome將利用機器學習(ML)模型,來預測使用者對網站通知的反應,並悄悄封鎖這些通知。雖然Google並未公布版本別,但從發布時程來看,該功能應該會出現在將6月下旬上線的Chrome 103。
Google認為,網頁通知一方面可傳遞網站更新給使用者,但不斷跳出通知也讓使用者不堪其擾。有別於先前將資料傳送至Google分析、判斷是否要阻擋特定通知,新版Chrome將利用ML模型,直接在裝置上預測。未來,新ML模型判斷要忽略後,會直接將通知靜音、封鎖,並在網址列上秀出該資訊,使用者依然可自行開啟通知。Google也預告,未來將讓ML模型依使用者習慣,自動調整Chrome瀏覽器上的工具列順序。(詳全文)
DataRobot Google雲端市集 AutoML
DataRobot服務進駐Google軟體雲端市集
專門提供AutoML和MLOps服務的廠商DataRobot,日前在自家年會上宣布自家服務進駐Google雲端市集,意味著DataRobot顧客也可享用Google雲端服務,來簡化購買流程和部署流程,讓AI建模更容易、直接在Google雲端打造符合自身需求的解決方案。
原本採用DataRobot AI Cloud服務的使用者,也能無縫使用Google雲端函式庫的服務,像是BigQuery、Looker、Vertex AI等,來建模、訓練、部署和管理AI模型,不論是地端或雲端都可支援。(詳全文)
吳恩達 LaMDA 測試基準
吳恩達回應LaMDA爭議:AI有無意識是哲學問題,除非人類定義出意識和感知的明確基準
先前Google傳出工程師Blake Lemoine在與AI語言模型LaMDA的對話過程中,認為LaMDA具備人類的感知(Sentience)能力,引起各界譁然。AI意見領袖吳恩達對AI具備感知表示懷疑,他指出,人類要判斷AI是否具備感知能力,是一個哲學問題,而非科學問題。因為,科學問題是可以反證的,比如,AI是否能擊敗人類象棋冠軍、能否精準翻譯、安全駕車,或是能否通過圖靈測試等。這些是可測試的問題。
但是,人類目前還沒有完整的系統,來測試AI是否具備意識、感知能力,又或只是通用AI(即GAI)。吳恩達也舉例說明人類世界的哲學問題,比如,人性是善是惡、生命的意義,以及昆蟲是否具備意識等都屬於哲學問題,同理,AI可否具備感知能力或意識、AI能否感受到情緒、能否理解它讀到的或看到的事物,也都是哲學問題。
「要打造出公認的AI意識和感知測試系統很難,也許不可能,」他認為,除非未來人類能建立評估AI意識和感知的基準測試(Benchmark),否則很難衡量這些AI發展的里程碑。(詳全文)
圖片來源/Coursera、Line Today、微軟、Meta、Google、吳恩達
AI近期新聞
1. Amazon無人機商品遞送服務終於起飛了
2. Spotify收購模擬《捍衛戰士》「冰人」聲音的AI公司
資料來源:iThome整理,2022年6月
熱門新聞
2024-09-10
2024-09-09
2024-09-06
2024-09-09
2024-09-09
2024-09-10
2024-09-10
2024-09-11