老鸭窝av在线_午夜视频在线观_婷婷六月国产精品久久不卡_亚洲AV成人无码网站天堂久久_亚洲欧美激情四射在线日_麻豆视频在线播放_亚洲一区美女_一本一本久久a久久综合精品_国产一级久久久_欧美大电影免费观看

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

人工智能的訓練數據正在枯竭,合成數據引發巨大爭議

2024年8月13日 07:13  華爾街見聞  

在AI的繁榮中,訓練數據已成為最寶貴的資源之一,而能夠以低成本且看似無限地生成這些數據的前景無疑極具吸引力。但是一些人認為,合成數據可能會導致AI模型因低質量信息而“自我中毒”,最終可能導致模型“崩潰”。

AI行業面臨一個重大問題:用于訓練更智能模型的真實世界數據正在耗盡。研究表明,合成數據可能會通過低質量信息“毒害”人工智能。

人工智能領域正處于其最寶貴資源即將耗盡的邊緣,這促使行業領袖們展開激烈的辯論,討論一種快速發展的替代方案:合成數據,或稱“虛假”數據。

多年來,像OpenAI和谷歌(163.95, -1.44, -0.87%)這樣的公司一直從互聯網上抓取數據,用于訓練支撐其AI工具和功能的大型語言模型(LLM)。這些LLM處理了由人類在數個世紀間創作的大量文本、視頻及其他媒體內容無論是研究論文、小說還是YouTube視頻片段。

然而,現在“真實”的人類生成數據正逐漸枯竭。研究公司Epoch AI預測,文本數據可能在2028年之前就會耗盡。同時,那些已經從互聯網的各個角落挖掘出可用訓練數據的公司有時甚至不惜打破政策來獲取數據正面臨著越來越多的限制。

對于一些人來說,這并不一定是個問題。OpenAI的首席執行官薩姆·阿爾特曼(Sam Altman)曾表示,AI模型最終應該能夠生成足夠高質量的合成數據,以有效地自我訓練。其吸引力顯而易見:在AI的繁榮中,訓練數據已成為最寶貴的資源之一,而能夠以低成本且看似無限地生成這些數據的前景無疑極具吸引力。

然而,研究人員對合成數據是否真的是靈丹妙藥仍存在爭議。一些人認為,這條道路可能會導致AI模型因低質量信息而“自我中毒”,最終可能導致模型“崩潰”。

牛津大學和劍橋大學的一組研究人員最近發表的一篇論文指出,將AI生成的數據輸入模型,最終會導致其輸出無意義的內容。作者發現,AI生成的數據并非完全不可用于訓練,但應與真實世界的數據相平衡使用。

隨著可用的人類生成數據日益枯竭,越來越多的公司開始考慮使用合成數據。2021年,研究公司Gartner預測,到2024年,用于開發AI的數據中有60%將是合成生成的。

“這是一場危機,”紐約大學心理學和神經科學榮休教授、AI分析師加里·馬庫斯表示。“人們曾經幻想著,只要使用越來越多的數據,就能無限提升大型語言模型的性能,但現在他們基本上已經用盡了所有可以使用的數據。”

他補充道:“沒錯,合成數據可能會幫助解決一些問題,但更深層次的問題在于,這些系統并不真正進行推理,也不會真正進行規劃。你能想象的所有合成數據都無法解決這一根本性問題。”

越來越多的公司開始生成合成數據

對“虛假”數據的需求取決于一個關鍵概念:真實世界的數據正迅速耗盡。

這部分原因在于,科技公司一直在盡可能快地利用公開數據來訓練人工智能,以超越競爭對手。另一方面,在線數據的擁有者也越來越警惕公司免費獲取他們的數據。

2020年,OpenAI的研究人員透露,他們利用來自Common Crawl的免費數據來訓練最終為ChatGPT提供支持的AI模型。Common Crawl是一個網絡爬蟲,OpenAI表示其中包含了“近一萬億字”的在線資源。

今年7月,數據來源倡議組織發布的研究發現,各大網站正在采取限制措施,阻止AI公司使用不屬于它們的數據。新聞出版物和其他熱門網站也越來越多地禁止AI公司自由地獲取它們的數據。

為了解決這一問題,OpenAI和谷歌等公司紛紛支付數千萬美元,獲取Reddit和新聞媒體的數據訪問權限,這些數據源為訓練模型提供了新鮮的數據。然而,即便如此,這種方法也有其局限性。

“文本網絡中已經沒有大量等待被抓取的區域了,”艾倫人工智能研究所的研究員內森·蘭伯特在今年5月寫道。

這時,合成數據應運而生。合成數據并非來自真實世界,而是由已經在真實數據上訓練過的AI系統生成的。

例如,今年6月,英偉達發布了一款AI模型,能夠生成用于訓練和校準的人工數據集。7月,中國科技巨頭騰訊的研究人員推出了一個名為Persona Hub的合成數據生成器,功能類似。

一些初創公司,如Gretel和SynthLabs,甚至專門成立,致力于生成并出售大量特定類型的數據,滿足有此需求的企業。

合成數據的支持者為其使用提供了合理的理由。與真實世界一樣,人類生成的數據往往是混亂的,研究人員在使用之前必須經過復雜且費力的清理和標注工作。

合成數據可以填補人類數據無法覆蓋的空白。例如,7月下旬,Meta推出了Llama 3.1,這是一系列新的AI模型,能夠生成合成數據,并依賴這些數據進行訓練中的“微調”。特別是在一些特定技能上,如用Python、Java和Rust等語言進行編程,以及解決數學問題,合成數據有助于提升模型的性能。

合成訓練對較小的AI模型可能特別有效。去年,微軟(406.81, 0.79, 0.19%)表示,他們為OpenAI的模型提供了一份多樣化的詞匯表,這些詞匯是典型的3至4歲兒童會知道的,然后要求模型使用這些詞匯生成短篇故事。生成的數據集被用來創建一組小型但功能強大的語言模型。

此外,合成數據還有助于有效地“反調校”由現實世界數據所產生的偏見。在2021年發表的論文《論隨機鸚鵡的危險》中,前谷歌研究員蒂姆尼特·蓋布魯、瑪格麗特·米切爾及其他人指出,基于來自互聯網的大型文本數據集訓練的大型語言模型很可能反映出數據中的偏見。

今年4月,谷歌DeepMind的一組研究人員發表了一篇論文,提倡使用合成數據來解決訓練中的數據稀缺和隱私問題。他們指出,確保這些AI生成數據的準確性和無偏性“仍然是一個關鍵挑戰”。

“哈布斯堡AI”

盡管AI行業在合成數據中發現了一些優勢,但它也面臨著不可忽視的嚴重問題,例如擔心合成數據可能會破壞AI模型。

在Meta關于Llama 3.1的研究論文中,該公司表示,使用其最新模型的4050億參數版本進行自生成數據的訓練“并沒有幫助”,甚至可能“降低性能”。

上個月發表在《自然》雜志的一項研究發現,在模型訓練中“濫用”合成數據可能導致“不可逆的缺陷”。研究人員將這一現象稱為“模型崩潰”,并表示如果我們希望持續享受從網絡抓取的大規模數據中訓練所帶來的益處,就必須認真對待這個問題。

蒙納士大學高級研究員賈森·薩多斯基為這個想法創造了一個術語:“哈布斯堡AI”,靈感來源于奧地利哈布斯堡王朝,一些歷史學家認為這個王朝因近親繁殖而自我毀滅。自從提出這一術語以來,薩多斯基告訴《商業內幕》,隨著越來越多的研究支持他關于模型過度依賴AI生成輸出可能導致變異的觀點,他感到這一想法得到了驗證。

薩多斯基表示:“對于構建AI系統的研究人員和公司來說,尚未解決的問題是:到底有多少合成數據才算過量?” 他還補充說,他們需要找到任何可能的解決方案,以克服AI系統數據稀缺的挑戰,但他也指出,其中一些解決方案可能只是短期修復,最終可能弊大于利。

然而,4月份發表的研究發現,如果模型在訓練時同時使用“真實”數據和合成數據,它們不一定會“崩潰”。現在,一些公司正在押注“混合數據”的未來,即通過使用部分真實數據生成合成數據,以防止模型偏離軌道。

幫助公司標注和測試數據的Scale AI表示,他們正在探索“混合數據”的方向,結合使用合成和非合成數據。Scale AI的首席執行官亞歷山大·王最近表示:“混合數據才是真正的未來。”

尋求其他解決方案

AI可能需要采用新的方法,因為僅僅向模型中塞入更多數據的效果可能有限。

今年1月,谷歌DeepMind的一組研究人員或許證明了另一種方法的優點。當時,該公司宣布推出AlphaGeometry,這是一種能夠解決奧林匹克水平幾何問題的AI系統。

在一篇補充論文中,研究人員指出,AlphaGeometry采用了一種“神經符號”(neuro-symbolic)方法,這種方法結合了其他AI方法的優勢,介于依賴大量數據的深度學習模型與基于規則的邏輯推理之間。IBM(189.48, -1.97, -1.03%)的研究團隊表示,這可能是一條實現通用人工智能(AGI)的途徑。

更值得注意的是,在AlphaGeometry的案例中,它完全是在合成數據上進行預訓練的。

神經符號AI領域相對較新,它是否能推動AI的發展仍有待觀察。

鑒于OpenAI、谷歌和微軟等公司在將AI熱潮轉化為利潤方面面臨的壓力,可以預見它們將嘗試一切可能的解決方案來應對數據危機。

“除非我們完全采用新的方法,否則我們基本上仍將陷入困境,”加里·馬庫斯說道。(BI)

本文作者:Chowdhury et al.,來源:AI新智能,原文標題:《人工智能的訓練數據正在枯竭,合成數據引發巨大爭議》

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
尚冰:中國互聯網應用蓬勃發展,多項關鍵指標位居全球第一
精彩專題
CES 2024國際消費電子展
2023年信息通信產業盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
午夜精品www| 四虎国产精品成人免费入口| 2019最新中文字幕| 欧美日本在线看| 久久亚洲一级片| 欧美日本一区| 99精品女人在线观看免费视频 | 日韩一级电影| 高潮在线视频| 国内精品卡一卡二卡三新区| 久热在线视频精品网站| 最新在线中文字幕| 欧美人与性囗牲恔配| 欧美午夜aaaaaa免费视频| 欧美日韩一区二 | 手机av在线| 欧美视频综合| 超碰av女优在线| 四虎影院免费在线| 中文字幕在线播出| √天堂中文官网8在线| theporn国产精品| 波多野结衣与黑人| 国产区二精品视| 国产97在线|日韩| 亚洲无亚洲人成网站77777| 在线观看网站黄不卡| 成人免费一区二区三区视频| 国产乱色国产精品免费视频| 欧美精品国产| 日韩夫妻性生活xx| 亚洲一区二区三区四区电影| zzzwww在线看片免费| 亚乱亚乱亚洲乱妇| 爽爽视频在线观看| 国产午夜电影| 免费看av的网址| free欧美性| 欧美精品另类| 毛片中文字幕| 狠狠躁日日躁夜夜躁av| 亚洲一区二区影视| 精品久久免费视频| 丝袜 亚洲 另类 欧美 重口| 97伦伦午夜电影理伦片| 女同性αv亚洲女同志| 亚洲天堂国产视频| 亚洲污视频在线观看| 91黄色小网站| 乱妇乱女熟妇熟女网站| r级无码视频在线观看| 免费看污污视频| 精品久久免费观看| 亚洲精品美女久久7777777| 鲁片一区二区三区| 国产一区视频观看| 亚洲综合精品一区二区| 91最新国产视频| 亚洲tv在线观看| 亚洲精品欧美日韩专区| 成人做爰www免费看视频网站| 国产成人拍精品视频午夜网站| 68精品久久久久久欧美| 98精品国产高清在线xxxx天堂| 高清欧美性猛交xxxx黑人猛交| 久久成人免费视频| 久久婷婷国产麻豆91天堂| 日韩亚洲第一页| 不卡av日日日| 97国产精品视频| 91超碰中文字幕久久精品| 2019日本中文字幕| 国产精品免费小视频| 成人免费观看a| 成人综合av网| 欧美一卡2卡3卡4卡无卡免费观看水多多 | 亚洲国产精品久久久久婷蜜芽| 天天做天天躁天天躁| wwwwww欧美| 久草青青在线观看| 国产精品久久久久9999小说| 亚洲精品久久久中文字幕| 亚洲欧美日韩三级| av免费观看不卡| 久久久久亚洲av无码a片| 日韩欧美国产成人精品免费| 精品成人久久久| 国产精品嫩草影院精东| 亚洲色图一二三区| 91深夜福利| 国产精品久久久久久精| 可以在线观看的黄色| av超碰免费在线| 成人啊v在线| 欧美巨大xxxx| 欧美激情1区| 久久狠狠亚洲综合| 久久综合九色综合久久久精品综合| 国产精品久久久久影院亚瑟| 日韩欧美精品免费在线| 日韩欧美三级在线| 欧美高跟鞋交xxxxxhd| 国产精品免费网站| 日产国产精品精品a∨| 国产在线视频综合| 黄色片子免费看| 午夜国产小视频| 中文字幕丰满人伦在线| 午夜男人天堂| 成人黄18免费网站| 在线观看免费高清完整| 欧美三区四区| 日韩国产欧美| 国产一区二区三区黄视频| 国产日韩视频一区二区三区| 日本道精品一区二区三区| 亚洲国产另类久久精品| 久久久久久91香蕉国产| 成人情视频高清免费观看电影| 欧美 日韩 国产 在线观看| 天天操,天天操| 成人三级视频在线观看| 国产裸体无遮挡| www.91av.com| 韩国中文免费在线视频| 456成人影院在线观看| 精品久久久久中文字幕小说 | 日韩av在线免费| 26uuu久久噜噜噜噜| 欧美最大成人综合网| 亚洲欧美日本一区二区三区| 久久国产波多野结衣| 国产成人精品无码高潮| 成年网站在线观看| a在线免费观看| 日韩美女国产精品| 秋霞成人午夜伦在线观看| **欧美大码日韩| 亚洲大胆人体视频| 国产精品女视频| 男女激情免费视频| 国产美女永久免费无遮挡| a视频免费在线观看| 天天色综合6| 新版的欧美在线视频| 欧美aaaa视频| 91丨porny丨户外露出| 欧美丰满嫩嫩电影| 国产精品久久久久久影视| 免费的av在线| 实拍女处破www免费看| av手机免费看| 国产911网站| 午夜激情成人网| 一本色道久久综合亚洲精品不| 国产精品麻豆久久久| 亚洲精品国产美女| av一本久道久久波多野结衣| 国产高清视频网站| 伊人久久久久久久久久久久 | 无码人妻久久一区二区三区 | 欧美怡红院视频一区二区三区| 一级一片免费播放| 麻豆精品免费视频| 人妻无码中文字幕| 偷拍25位美女撒尿视频在线观看| 色8久久久久| 久久亚洲一区| 91国偷自产一区二区三区成为亚洲经典 | 91大神在线网站| 久久99免费视频| 99re这里只有精品首页| 亚洲第一男人天堂| 国产乱码精品一区二区三区中文| 99精品视频国产| 国产精品一区二区人人爽| 97香蕉久久| 精品日产乱码久久久久久仙踪林| 高清国产一区二区三区| 亚洲电影天堂av| 久久久久久久久久久久久久一区| 日本不卡视频一区| 人人妻人人澡人人爽人人欧美一区| 在线看黄的网站| 色愁久久久久久| 久久久国产精华| www亚洲欧美| 久久av综合网| 无码人妻精品一区二区| 黑巨人与欧美精品一区| 高潮按摩久久久久久av免费| 久久综合久久综合九色| 久久精品视频中文字幕| 免费 成 人 黄 色| 国产九色91回来了| 日韩美女一级视频| 婷婷综合伊人| 国产精品久久午夜夜伦鲁鲁| 欧美精品免费在线观看| 日本一区二区黄色| 国产精品视频在线观看免费| 成全电影播放在线观看国语| 黄色av一区| 欧美日韩中文一区| 精品国产乱码一区二区三区四区| 粉嫩精品久久99综合一区| 福利片在线播放| 久久精品论坛| 亚洲综合在线视频| 成人www视频在线观看| 国产高清自拍视频| 91free张津瑜movies| 国产高清不卡| 91在线视频18| 欧美多人爱爱视频网站| 黄色一级片免费的| 成人男女网免费| 欧美日韩免费看片| 久久色在线视频| 97视频在线观看亚洲| 欧美图片自拍偷拍| 在线观看岛国片| 偷拍视屏一区| 欧美日韩午夜激情| 精品视频第一区| 久久精品国产亚洲av麻豆色欲| 3dmax动漫人物在线看| 亚洲精品tv久久久久久久久久| 在线观看三级视频欧美| 欧美一区二区在线| 无码人妻丰满熟妇奶水区码| 国产最新在线| 精品一区二区免费视频| 一区二区在线视频播放| 爱豆国产剧免费观看大全剧苏畅| 欧美黑人疯狂性受xxxxx喷水| 色综合久久久| 国产精品久久一级| 成人网在线免费看| 美女毛片在线观看| 福利视频在线看| 久88久久88久久久| 欧美激情网友自拍| 成人午夜剧场视频网站| 色琪琪丁香婷婷综合久久| 精品69视频一区二区三区Q| 亚洲精品黄网在线观看| 日韩欧美在线免费观看视频| 久热在线视频精品网站| 久久99性xxx老妇胖精品| 欧美日韩性生活| 欧美午夜小视频| 欧美一级黄色带| 亚洲综合图色| 在线电影院国产精品| 欧美这里只有精品| 最新中文乱码字字幕在线| 成人18夜夜网深夜福利网| 欧美亚洲综合另类| 久久亚洲精品无码va白人极品| 四虎永久在线观看免费网站网址| 日韩理论电影中文字幕| 4438成人网| 成人观看免费完整观看| 桃乃木香奈和黑人aⅴ在线播放| 久久中文字幕二区| 日韩精品久久久久| 少妇性l交大片7724com| 日本成本人片免费观看| 三级在线观看一区二区| 欧美极品少妇xxxxⅹ免费视频| 国产视频不卡在线| 日本免费中文字幕在线| 久久久精品一品道一区| 精品一区二区日本| 亚洲国产精品久久久久久久| 成人资源在线| 精品国产免费视频| 一起草最新网址| 在线播放av网站| 99这里都是精品| 国产精品视频免费一区二区三区| 99久久精品国产成人一区二区| 中文字幕日韩在线| 欧美一区二区三区啪啪| 国产欧美激情视频| 一级黄色av| jlzzjlzz国产精品久久| 国产另类自拍| 无套内谢的新婚少妇国语播放| 九九免费精品视频在线观看| 日韩高清a**址| 黄色在线观看av| 免费成人黄色| 亚洲免费成人av| 国产专区在线视频| 色的视频在线观看免费播放| 国产精品视区| 国产精品黄视频| 夜夜嗨av禁果av粉嫩avhd| 超碰成人免费| 中文字幕日韩免费视频| 国产日韩欧美在线观看视频| 国产拍在线视频| 欧美日韩亚洲国产综合| 色婷婷狠狠18禁久久| 成年人在线免费观看| 国产精品福利一区| 成人在线视频一区二区三区| 国产免费视频| aaa欧美日韩| 秋霞久久久久久一区二区| 国产免费1000拍拍拍| 视频一区在线视频| 91精品国产三级| www.日韩不卡电影av| 久久精品视频免费在线观看| 欧美一级xxxx| 国产高清一区视频| 欧美一区二区私人影院日本| 夜夜嗨网站十八久久| www.亚洲精品| 成人国产一区二区三区| 亚洲福利在线视频| 久久综合九色综合久久久精品综合| av资源一区| 久久精品免视着国产成人| 国产精品扒开腿做爽爽| 国产精品网站免费| 美女网站免费看| 美女www一区二区| 国产视频在线观看一区| 亚洲va在线va天堂成人| 中国国产一级毛片| av一区二区三区四区| 日韩欧美国产高清91| 国产一区二区在线观看免费视频| 国产片在线观看| 亚洲国产欧美另类丝袜| 中文av字幕在线观看| 婷婷成人激情| 91成人免费网站| aaaaaav| 欧美香蕉视频| 日韩精品黄色网| 日韩av片在线播放| 日韩aaa久久蜜桃av| 午夜精品一区二区三区在线视频| 一级久久久久久久| 亚洲人metart人体| 国产剧情日韩欧美| 午夜剧场日韩| 国内外成人在线| 黄黄视频在线观看| 超碰在线公开免费| 亚洲综合一区二区精品导航| 免费看三级黄色片| 男人久久天堂| 亚洲男人天天操| 国产一级片av| 激情欧美日韩| 久久久久久精| 美女在线一区| 午夜视频在线观看一区二区三区| 一级黄色电影片| 精品久久99| 久久精品国产成人精品| 一级片在线观看视频| 一区二区日韩免费看| 欧美日韩精品久久| 粉嫩欧美一区二区三区| 精品久久久久久久久中文字幕| 黄色短视频在线观看| 日韩欧美久久| 琪琪亚洲精品午夜在线| 69精品视频| 中文字幕国产精品一区二区| 中文字幕第10页| 欧美国产日韩电影| 九色91av视频| 日韩黄色成人| 国产欧美日韩不卡免费| 国产人妻精品久久久久野外| 姬川优奈av一区二区在线电影| 在线视频欧美性高潮| 亚洲第一色网站| 国产一区二区在线影院| 97xxxxx| 成人国产精品| 欧美怡红院视频一区二区三区| 国产成人羞羞电影网站在线观看| 国产欧美日韩综合| 色婷婷精品久久二区二区密| 一区二区三区国产好| 国产精品视频色| 日本加勒比高清在线| 色天使久久综合网天天| 在线观看中文字幕视频| 香蕉国产精品偷在线观看不卡| 可以在线看黄的网站|