OpenAI推出Deep Research功能,能夠整合網路上大量分散資訊,自動執行多步驟研究,最後產出報告結果。根據官方資料,該系統利用端對端的強化學習技術,經由大量針對困難瀏覽與推理任務的訓練,學會自主規畫並執行多步驟資訊搜尋流程。藉由與內建Python工具的整合,Deep Research不僅能夠繪製圖表、嵌入網站圖片,還能精確引用來源文字,以滿足研究報告對技術性與細節的需求。

從技術層面來看,Deep Research採用了強化學習與多模態推理相結合的方法,使得系統能夠根據使用者的提示自動調整搜尋策略。該模型可以在需要時主動回溯與調整搜尋路徑,進而應對網路上資訊量龐大且複雜的內容彙整挑戰。此外,其內建的Python工具能夠動態生成與迭代圖形,並將分析結果嵌入最終的報告中。Deep Research不僅可提供資料視覺化效果,也大幅降低了人力整理資訊的負擔。

根據OpenAI內部評估結果,在Humanity's Last Exam這項涵蓋多領域專家級問題的測試中,Deep Research取得了26.6%的準確率,相較於其他先進的語言模型,諸如OpenAI o3-mini_high 13.0%、DeepSeek-R1 9.4%與OpenAI o1 9.1%,Deep Research具有高精確的優勢。

另一項在GAIA基準測試平臺進行的試驗顯示,在面對3個不同難度等級的問題時,Deep Research在pass@1測試中,準確率分別達到74.29%、69.06%與47.6%,平均分67.36%,而在更密集的cons@64測試下,其各難度平均準確率更達到72.57%,這些資料呈現出Deep Research在多步驟推理、網頁瀏覽與工具運用上的綜合能力。

Deep Research目前主要提供給Pro用戶使用,未來將逐步擴展至Plus、Team與Enterprise等更多使用者。OpenAI表示,除了目前能夠存取的開放網路資料外,未來Deep Research還將連接更多專業訂閱資源與內部資料庫,以進一步提升報告資訊的豐富性與精準性。

在去年底時,Google就在其Gemini服務中加入了的Deep Research功能,採用Gemini 1.5 Pro模型,代使用者上網搜尋並深入研究複雜主題,生成條理清晰的報告,並支援直接匯出至Google Docs。史丹佛大學也推出類似Deep Research的研究計畫,稱之為STORM,採用Bing搜尋引擎尋找網路資料,助使用者編寫類似維基百科的文章。

熱門新聞

Advertisement