| Mozilla | Common Voice | 資料集

Mozilla釋出最新長達7,226個小時的Common Voice語音資料集

最新的語音資料集共包含54種語言,550萬個語音剪輯,總語音長度達7,226個小時。

2020-07-06

| google | 少樣本分類 | 資料集

Google釋出少樣本學習資料集Meta-Dataset

少樣本分類是讓模型只以幾張圖像就能進行分類,而Meta-Dataset提供了一個用於評估少樣本分類模型效能的基準

2020-05-15

| google | Borg | 資料集

Google開放比8年前更大更完整的Borg叢集追蹤資料,供雲端技術研究用

由於機器與軟體經過8年發展,已經與過去有很多大的不同,因此Google再次釋出新的Borg叢集追蹤資料

2020-04-30

| google | 聲音分離 | 人工智慧 | 資料集

Google開源可用來訓練聲音分離模型的資料集FUSS

Google利用CC授權的音訊剪輯,結合使用自家開發的房間模擬器,創建了2萬多個訓練、驗證和評估用的錄音

2020-04-11

| 國網中心 | 超級電腦 | AI | 武漢肺炎 | 資料集 | 算力

你有鍵盤、我有算力!國網中心免費釋出超級電腦資源,號召各界提案來開發防疫應用

為加速遏止武漢肺炎疫情,科技部國研院國網中心宣布啟動「御守臺灣・科技抗疫」專案,將釋出臺灣AI雲的算力和資料集平臺資源,號召各界好手來發想、提案,主題不限於醫療相關。

2020-04-02

| AI | 史丹佛大學 | 機器人 | RoboTurk | 資料集 | Amazon | GAN | 英特爾 | 知識圖譜 | google | 二階梯度優化 | 臉書 | FastMRI

AI趨勢周報第122期:機器界ImageNet!史丹佛開源最大機器人操作影片資料集RoboTurk

史丹佛大學2年前展開RoboTurk專案,以群眾外包來收集操作機器手臂的示範影片,近日釋出RoboTurk資料集,要來推進機器人策略學習等;另一方面,Google發表超強深度學習二階梯度優化法,比前一代更省運算資源,同時也比所有一階優化器要快;英特爾用AI爬梳上百萬家企業網頁,透過知識圖譜從中找出有潛力的產業領頭羊,作為潛在客戶名單。

2020-03-05

| 社會科學 | 臉書 | 個資 | GDPR | 劍橋分析 | 資料集 | 社交媒體 | Social Science One

Social Science One及臉書終於釋出內含3,800萬個網址的資料集

此一資料集將讓社會科學家得以取得過去他們無法存取的資料,藉以研究社交媒體對民主與選舉的影響

2020-02-15

| google | 機器學習 | 透明物體 | 3D | 資料集 | RGB-D | 機器人

Google讓機器人也能正確辨識透明物體

由於透明物體有折射與反射光線的特性,因此一般光學感測器無法正確取得透明物體的深度,導致機器人無法順利抓取或是移動透明物體

2020-02-14

| 資料集 | 光達 | 自駕車

開源寒冬環境影像資料集CADC可助自駕車應付下雪路況

下雪路況不只讓車道難以辨識,雪也會使得光達與攝影機無法正常作用,自駕車模型需要從更完整的下雪行車資料集中學習

2020-02-05

| Dataset Search | schema.org | 資料集 | 搜尋引擎 | google | 資料使用 | 開放資料

Google資料集搜尋引擎Dataset Search正式版出爐了,已索引2,500萬個資料集

Dataset Search提供經組織且結構化的各類資料集以及政府開放資料,格式包括照片、表格或文字,目前以地球科學、生物學及農業類別資料為大宗

2020-01-24

| 臉書 | 紐約大學 | FastMRI | 資料集 | AI

研究計畫FastMRI釋出腦部MRI資料集

由FastMRI釋出的這個神經成像資料集,包含龐大k-space格式腦部MRI的公開數據集,可用來訓練機器學習模型並驗證結果

2019-12-14

| google | 資料集 | 氣候

Google公開資料集釋出最新CMIP6氣候資料

模擬各種極端氣候的模型資料CMIP6檔案大小高達20PB,目前先在Google雲端公開了100TB

2019-12-11