AI趨勢周報第213期：HuggingFace開源聊天機器人，猶如ChatGPT複製版

圖片來源:

HuggingFace

重點新聞(0421～0427)

HuggingFace ChatGPT HuggingChat

HuggingFace開源聊天機器人HuggingChat，號稱媲美ChatGPT

知名AI新創暨開源社群HuggingFace剛開源一款聊天機器人HuggingChat，一般使用者可拿來對話、寫程式、寫電子郵件甚至是饒舌歌詞，開發者則能用開源程式碼來打造更多應用，或用HuggingFace的API來串接第三方App。

這款聊天機器人採用Open Assistant開源助理專案的模型，該專案是由德國一間非營利組織LAION發起，該組織因建立文字轉圖像AI模型Stable Diffusion的訓練資料而聞名。Open Assistant的目的要提供可在通用硬體上執行的對話式AI，且要能根據個人需求來個人化回答。目前，Open Assistant模型以Meta的大型語言模型LLaLM為基礎來運行，但長期計畫是要採用各類大型語言模型，來提供更強大的對話功能。（詳全文）

CancerGPT 癌症 協同作用

美國大學聯手打造CancerGPT，可良好預測癌症藥物協同作用

美國德州大學、麻州大學阿默斯特分校以及德州大學健康科學中心聯手打造一款大型語言模型CancerGPT，擁有1.24億參數，可預測一組組藥物在特定人體組織中的協同作用（Synergy），甚至其少樣本預測的能力，可比具1,750億參數的GPT-3。

進一步來說，長年的實驗證明，多種藥物組合比單一藥物的治療還有效，特別是對癌症、神經系統失調等疾病。但要找出合適的藥物組合，仍是一大挑戰。鑑於目前的藥物研究側重於預測藥物協同作用，美國幾所大學研究團隊決定採用大型語言模型，利用模型已具備的科學知識，再透過小樣本訓練，來預測藥物協同作用。經測試，團隊發現，CancerGPT即使在零樣本條件下，也能獲得相當高的準確性，替通用生物醫學AI埋下伏筆。（詳全文）

Google Bard 除錯

Google Bard也能幫寫程式碼和除錯了

Google持續強化聊天機器人Bard，最近宣布Bard可協助開發者撰寫程式碼和除錯了。今年3月，Google才以預覽版開放美、英少數用戶申請試用Bard，現在，除了草擬文章、邀請函、整理會議待辦事項、解答使用者提問功能外，還新添開發輔助功能，像是生成程式碼、為程式碼除錯及提供解釋的能力。

Google表示，Bard支援C++、Go、Java、Javascript、Python和Typescript等20多種程式語言。開發者可將Python程式碼匯出到線上Python編輯器Google Colab，不需複製貼上。此外，Bard還可協助Google Sheets試算表的函式撰寫，甚至在程式除錯部分，還能更正自己撰寫的程式碼。（詳全文）

李長榮 化工 污水處理

臺灣老字號化工廠靠AI每日多處理3倍污水量

成立將近60年的李長榮化工，近日揭露如何用AI提高製程中水回收效率，達到年省437萬公噸工廠用水，相當於1,750座奧運池。李長榮化工以生產醫療、工業及家庭用品常用的聚丙烯、甲醇、溶劑和熱可塑性橡膠為主，在製程中，許多環節都需要消耗大量的水資源。為了節水，他們很早就導入MBR廢水處理系統，來在製程中重複使用。

不過，工廠製程廢水處理，得靠一群生長在⽣物淨化池裡的活性菌種，來處理污水中的微⽣物。為讓養菌更容易，李長榮化工IT團隊打造一套AI馴養控制系統，可根據菌種曝氣池中的環境數據，如溶氧值，來掌握菌種的活動狀態、決定何時該曝氣，以此提高水中含氧量，讓菌種的活動力維持在最佳狀態，提高汙水處理的品質。他們也發現，導入這套系統後，製程污水處理效率大幅提升，從2021年每天平均處理3,661立方公尺，到2023年的每日11,866立方公尺排放量，迄今更可做到年省437萬公噸的工廠用水。（詳全文）

資安 生成式AI 情資分析

Google也用生成式AI強化自家資安解決方案了

Google更新自家安全解決方案，在Security AI Workbench、VirusTotal Code Insight和Mandiant Breach Analytics for Chronicle等三大資安服務中整合大型語言模型Sec-PaLM，來新添情資分析等功能。

比如在Security AI Workbench平臺中，Sec-PaLM就用來提供威脅態勢、Mandiant漏洞、惡意軟體、威脅指標和威脅參與者基本資料等訊息。再來，用戶可申請使用安全解決方案VirusTotal Code Insight預覽，來享有Sec-PaLM加持的惡意腳本行為分析和解釋功能。而Mandiant Breach Analytics for Chronicle也整合Sec-PaLM，讓用戶不需要學習新語法，就能用自然語言搜尋安全事件，並進一步分析搜尋結果，或快速建立掃描任務。

不只如此，Google安全指揮中心也用Sec-PaLM，來將複雜的攻擊圖轉換為人類可讀的攻擊解釋，說明可能受影響的資產和建議解方，同時還能對安全、法遵和隱私生成風險摘要。（詳全文）

莫德納 量子電腦 新藥發現

莫德納藥廠要用生成式AI和量子運算來探索新藥

美國莫德納藥廠（Moderna）日前宣布要用IBM的生成式AI和量子運算技術，來加強mRNA研究與藥物開發。進一步來說，莫德納將使用IBM的基礎模型MoLFormer，來預測化學分子屬性，幫助研究團隊了解mRNA藥物的特性。

其中，MoLFormer是一個大型化學語言模型，可根據小型分子的活動來訓練。團隊希望透過該模型，來最佳化保護mRNA的脂質奈米粒，並用生成式AI來改良配方，設計出最安全有效的mRNA藥物。同時，莫德納也將加入IBM量子加速器計畫和IBM量子網路，來使用IBM量子運算系統進行生技研究。（詳全文）

通用AI DeepMind Google

Google整併AI研發部門，專攻通用AI

Google執行長Sundar Pichai宣布合併Alphabet子公司DeepMind和Google研究院的Google Brain部門，成立新事業群Google DeepMind，全力發展AI技術。這個新事業群，將由DeepMind執行長Demis Hassabis掌舵，將帶頭開發負責任通用型AI系統，而Google Brain領導人Jeff Dean則升為Google研究院及DeepMind首席科學家，負責帶領關鍵AI技術專案，如多模態AI模型開發。

此外，Google DeepMind將整合Google Brain和DeepMind的AI研發成果，包括AlphaGo、Transformer、文字表示模型word2vec、音訊波形深度生成模型WaveNet、蛋白質結構預測模型AlphaFold、序列到序列模型、蒸餾技術、深度強化學習、分散式系統及TensorFlow、JAX等用於表徵、訓練及部署大型ML模型的軟體框架。（詳全文）

Stability AI 生成式AI 大型語言模型

Stability AI開源數十億參數LLM模型，雖小但高效能

AI新創公司Stability AI最近開源可生成文字和程式碼的大型語言模型（LLM）StableLM，包括30億參數和70億參數版本的模型，之後還會新添150億和650億參數的版本。Stability AI表示，StableLM作為基礎模型，可產生文字和程式碼，衍生多種應用，證實小模型只要經適當訓練，也能高效能產出。

StableLM的訓練資料來自The Pile的最新實驗性資料集，內容含1.5兆個token，資料集相當豐富。也因此，即使StableLM模型只有30億到70億個參數，但能在對話和寫程式任務上能提供極高效能。此外，Stability AI也將開源經指令微調的研究模型，這組模型將使用近日開源的5個聊天機器人的綜合資料集來訓練，包括Alpaca、GPT4AII、Dolly、ShareGPT和HH等。（詳全文）

圖片來源／德州大學、Google

攝影 / 余至浩

AI近期新聞

1. Meta開源可以把素描變成動畫的AI專案Animated Drawings

2. Amazon推出雲端AI模型平臺Bedrock、大型語言模型Titan

資料來源：iThome整理，2023年4月

熱門新聞