圖片來源: 

Canva

重點新聞(0606~0612)

 AI輔助開發     Canva     面試  

Canva改寫徵才規則,要求開發者面試時用AI輔助寫程式

設計平臺大廠Canva大改技術人才面試條件,強烈建議前後端、機器學習等職缺應徵者,在面試中使用AI輔助工具,如Copilot、Cursor或Claude等,更貼近Canva自家的開發日常。Canva進一步說明,自家近半數的前後端團隊成員,每天都用AI工具來設計原型、理解龐大的程式碼庫和生成程式碼。他們認為,舊有不允許使用AI的面試,已與實務脫節了。

因此,Canva先在一次面試中試行,以AI輔助開發,取代傳統電腦科學基礎考題,並觀察面試者如何用AI工具、如何拆解複雜且模糊的需求、如何在使用AI的同時做出合理決策、能否識別並修復AI生成的程式碼問題,以及有能力確保AI生成的解決方案符合上線標準。Canva發現,表現最好的面試者,不但會詢問詳細的產品需求,也會策略性的使用AI完成任務,還能在AI出現問題時完善調整,也能嚴謹審查AI生成的程式碼並修正。

於是,Canva決定調整未來的開發者面試規則,以AI輔助開發為主,同時納入新流程,來評估受試者的電腦科學基礎知識。Canva表示,他們會提前告知面試者,面試會要求他們使用AI工具,並強烈建議在面試前就練習用這些工具。Canva認為,這種面試模式,可以幫助他們挑出深思熟慮、能有效利用AI的工程師,成為實務所需的人才。(詳全文)

蘋果     推理模型     LLM  

蘋果:推理模型並非真的會推理

最近,蘋果發布一項推理模型研究報告《The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity》,探討問題的複雜度,是否會影響推理模型表現。他們發現,問題很簡單時,AI的回答看起來很聰明,一旦問題變得複雜,模型就會曝露局限性。

研究人員以《河內塔》(Tower of Hanoi)和最短路徑等經典邏輯遊戲來測試LLM與LRM,結果發現,在低複雜度下,非思考模型相對準確;隨著複雜度的增加,推理模型表現更好,但需要更多的Token。而在高難度下,不管是LLM或LRM都會故障。更意外的是,就算提供模型正確的演算法,仍無法明顯改善表現,而且不論是什麼種類的問題,模型都無法將推理能力延伸到訓練資料以外的內容。

科技領域投資人Josh Wolfe總結,LLM會過度思考簡單問題,遇到複雜問題時,卻在還有很多運算資源時便早早放棄;就算掌握正確的演算法,也還是會搞砸,顯示模型缺乏的是基本邏輯。這意味著,這些模型不具備推理能力。(詳全文)

  機器人     Hugging Face     視覺  

Hugging Face開源輕量機器人模型,主打Mac也能跑

Hugging Face最新開源SmolVLA,是一款只有4.5億參數、可在Mac電腦等消費級硬體上執行的視覺語言動作模型(VLA),主打低門檻、高泛化能力。進一步來說,這套SmolVLA整合了Transformer和flow-matching解碼器,採4大技術:

1. 在視覺模型中跳過一半層數,來加速模型推論速度

2. 混合自注意與交叉注意力區塊,強化多模態訊息整合效率

3. 使用少量視覺Token,來提高處理速度

4. 用更輕量的SmolVLM2進行預訓練,降低硬體需求

即使訓練資料不到3萬筆,SmolVLA在LIBERO、Meta-World等基準模擬測試中,表現比更大型的模型如Octo、OpenVLA等還要好。模型與訓練程式碼分別釋出於Hugging Face與GitHub。(詳全文)

  WWDC    蘋果      基礎模型框架  

蘋果發表基礎模型框架

在日前舉行的WWDC大會上,蘋果發表一套基礎模型框架(Foundation Models Framework),允許第三方開發者存取蘋果裝置上內建的大型語言模型,也就是Apple Intelligence所使用的模型,來在程式中整合AI能力。

這個裝置內建的大型語言模型,擅長各種文本生成任務,如摘要、實體萃取、文字理解、優化、遊戲對話和創意內容生成等。而基礎模型框架可讓開發者建置AI驅動功能,既可離線、保護使用者隱私,也不會產生推理成本,例如教育應用程式可根據裝置上的使用者筆記生成測驗,戶外應用程式也能添加自然語言搜尋功能,讓使用者也能離線使用。

這套基礎模型框架原生支援Swift,開發者只需寫短短的3行程式碼,就能存取Apple Intelligence模型。該框架即日起在蘋果開發者計畫(Apple Developer Program)展開測試,公測版將於下個月由Apple Beta Software Program釋出。(詳全文)

  o3-pro     OpenAI     思考  

OpenAI揭露o3-pro模型

日前,OpenAI揭露最新推理模型o3-pro,價格比o1-pro便宜87%,o3模型費用也降價80%。OpenAI o3-pro是用來取代o1-pro模型,即日起供ChatGPT Pro和Team方案用戶在模型選單中選用,Enterprise和Edu用戶很快也能使用。此外,o3-pro也透過Responses API開放給開發人員。

o3-pro是OpenAI最強的智慧模型,其設計宗旨是思考更久,並提供更可靠的回答。和o3一樣,o3-pro可使用工具,如搜尋網頁、分析檔案、理解視覺輸入、使用Python等,但也由於o3-pro使用工具,因此完成一項回應所需時間,比o1-pro更長。OpenAI建議將o3-pro用在更複雜、需要可靠答案而非要快速回答的問題。由於技術因素,o3-pro暫不提供即時對話功能,也暫不支援圖片生成。(詳全文)

  Xcode 26     AI助理     開發環境  

蘋果整合開發環境Xcode 26,導入AI助理

在日前WWDC 2025大會中,蘋果發表新版開發環境Xcode 26,整合了AI助理,正式支援ChatGPT並開放API連接第三方語言模型,來提高程式碼自動生成、錯誤修正、文件產生和專案導覽等工作效率。

進一步來說,Xcode 26的智慧程式開發(Coding Intelligence)功能,可讓開發者在側邊欄啟用AI助理,以自然語言與AI互動,執行程式碼範例、解釋專案架構、產生或修改特定函式等任務,也能請AI協助除錯或自動產生文件。開發者可選用預設的ChatGPT模型,或自訂加入如Anthropic、Ollama等本地或雲端模型,並透過API金鑰彈性切換與管理模型來源。(詳全文)

  開發工具     Cursor     程式碼審查  

AI輔助開發工具Cursor推出1.0正式版

AI輔助開發編輯器Cursor正式推出1.0版,更新亮點包括BugBot自動程式碼審查、Jupyter Notebook協作支援、背景代理(Background Agent)啟用與MCP一鍵部署。進一步來說,BugBot可在GitHub PR(提取要求)中自動檢查錯誤並具體留言,開發者可透過Fix in Cursor按鈕切換到編輯器,系統自動填入修正建議,加速修正。

背景代理則已全面開放,支援Cursor環境的即時遠端協作編輯;而Jupyter Notebook用戶可透過代理直接編輯多段程式區塊,優化資料分析與原型開發流程。此外,新版本也支援MCP伺服器快速安裝和OAuth認證整合,降低部署門檻。Cursor 1.0也加入Memories記憶功能測試版,記錄專案上下文,加快團隊溝通。聊天室則新增Mermaid圖表與Markdown表格即時生成功能,搭配改版儀表板,讓開發狀況更透明、容易追蹤。(詳全文)

  FDA     安全性審查     Elsa  

FDA推出通用AI工具Elsa,可望加速審查流程

美國食品藥物管理局(FDA)六月初宣布,原本預計6月30日全面部署的生成式AI工具Elsa,已提前上線。FDA指出,Elsa是一種由大型語言模型(LLM)驅動的AI工具,可協助閱讀、寫作和摘錄,能總結不良事件,來支援安全性評估、執行更快速的標籤比較,以及生成程式碼,來協助打造非臨床應用的資料庫。

FDA局長Marty Makary表示,FDA已經開始用Elsa加速臨床試驗審查,縮短科學評估所需的時間,還能識別高優先等級的檢查目標。他們舉例,一名科學審查員使用Elsa,在6分鐘內完成了原本需要2到3天的任務。一般來說,FDA收到藥物核准申請後,會在6至10個月中作出審查決定,而Elsa可望加速這個流程。在安全性上,Elsa建置於高安全性的GovCloud政府雲端環境中,FDA員工可安全存取內部檔案,同時確保所有資訊都保存在組織內。這些模型,不會用受監管產業提交的資料來訓練。(詳全文)

圖片來源/Canva、Hugging Face、蘋果

  AI近期新聞 

1. Mistral AI釋出首個推理模型Magistral

2. EleutherAI釋出集結合法開放資料的AI訓練資料集

3. NotebookLM現在可讓使用者公開分享筆記

資料來源:iThome整理,2025年6月

熱門新聞

Advertisement