資料集 | iThome

| Databricks | MLflow | 資料集 | AI agent

Databricks推出新API可迅速合成機器學習評估資料集

Databricks新的合成資料生成API，讓企業能在數分鐘內，根據專有資料自動生成機器學習評估資料集，支援自定義問題指南，並與現有評估平臺整合，提升人工智慧代理的測試與除錯效率

2024-12-12

| Overture Maps | 開放地圖 | 資料集

電子地圖基金會Overture Maps發布開放地圖資料集的正式版

由AWS、微軟、Meta及TomTom共同創立的Overture Maps基金會正式發表開放地圖資料集，包括全球23億個建築物，5千多萬個興趣點，支援逾40種語言的國家及地區的行政邊界，以及涵蓋水及土地的基礎資料

2024-07-25

Hugging Face公布可在手機上執行的語言模型SmolLM家族

Hugging Face研究人員公布小語言模型家族SmolLM，強調是以謹慎策畫的高品質資料集訓練而成，同時釋出該資料集並說明其內容及規畫方法

2024-07-18

| Youtube | AI模型 | 資料集

蘋果、Nvidia等公司被控未經同意使用YouTube文字內容訓練AI

調查報導媒體Proofnews分析發現，蘋果、Nvidia、Anthropic及Salesforce等業者，使用內含YouTube平臺17萬則公開影片字幕的《The Piles》資料集來訓練其AI模型，但《The Piles》資料集建立者並未取影片作者的使用許可

2024-07-17

| google | 皮膚科 | 資料集

Google公開皮膚病狀圖片資料集SCIN，涵蓋各種膚色與身體部位

Google與史丹佛大學合作創建皮膚病狀圖片資料集SCIN，主要收集不同膚色與身體部位，常見的皮膚病狀照片，補充臨床皮膚疾病資料集的不足

2024-03-20

AI趨勢周報第221期：超過1千萬個3D物件的大型資料集來了

多家頂尖AI研究機構聯手打造超大3D物件資料集，加速零樣本AI發展；彭博社研究發現Stable Diffusion也有膚色種族偏見；盤點全球23家銀行AI成熟度，摩根大通遙遙領先；微軟研究院用LLM打造AutoML工具，可自動調參、選最佳架構。

2023-07-16

| IT周報 | google | Transformer | 機器人 | 導航 | 資料集 | 搜尋 | 大型主機

AI趨勢周報第210期：Google用Transformer模型即時導航機器人

Google成功用Transformer模型即時導航機器人，延遲僅8毫秒；司法院法庭中文語音辨識系統正式上線，準確率超過9成；Google搜尋再優化，新添資料集搜索引擎；Brave搜尋引擎自建生成式AI，幫摘要搜尋結果；IBM大型主機作業系統將擁抱AI

2023-03-09

| 推特 | 資料外洩 | 資料集

推特調查確認未發生新的資料洩漏事件

推特調查近期一系列媒體報導推特使用者資料洩漏的新聞，表示未有新的資料洩漏事件發生，皆是重複以及未包含機密資訊的資料集

2023-01-12

| Linux基金會 | 資料集 | 農業

Linux基金會維護農地邊界資料集，預期將掀起農業服務革命

Linux基金會AgStack專案所維護的資料集Asset Registry，將會收集全球農地邊界，以用於食品追蹤、碳追蹤和田野分析等用例

2022-12-22

| google | 資料集 | 透明度 | Data Cards Playbook

Google釋出資料集透明度工具Data Cards Playbook

Google推出的Data Cards Playbook工具，可用於建立連續且具脈絡的資料及透明度，有了這個透明度基礎，開發人員才能更方便地開發負責任機器學習系統

2022-11-25

| google | 電腦視覺 | 資料集 | Open Images

電腦視覺資料集Open Images V7新增點標籤，可用於實例分割模型訓練

Open Images V7新加入點標籤，研究人員提到，使用點級標籤註解這類稀疏資料，訓練和評估分割模型，與密集註解資料所獲得的效果差不多

2022-11-01

| google | 地理多樣性 | 資料集 | 圖片說明

Google釋出地理多樣性圖片說明資料集Crossmodal-3600

Crossmodal-3600中的圖片涵蓋世界各地理位置，每張圖片都有36種語言的文字說明，能夠用於評估圖片說明生成模型研究

2022-10-16

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~01/27

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 2026 年 6 月 25-26 日（四 - 五）