人物專訪監(jiān)管
制造芯片
6G運(yùn)營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

中國信通院云計(jì)算與大數(shù)據(jù)研究所何寶宏:面向AI,數(shù)據(jù)技術(shù)體系正朝著“數(shù)智融合”方向演進(jìn)
飛象網(wǎng)訊 12月13日,在“2026中國信通院深度觀察報(bào)告會”上,中國信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏就面向AI的數(shù)據(jù)發(fā)展分享了自身思考和見解。

數(shù)據(jù)的規(guī)模、質(zhì)量決定大模型的上限
談及在AI大模型發(fā)展中,數(shù)據(jù)扮演的角色,何寶宏分別從AI和數(shù)據(jù)的發(fā)展兩個角度進(jìn)行了解答。他表示,早期的人工智能是基于規(guī)則,和數(shù)據(jù)關(guān)系不大;而這一波以大模型為代表的人工智能,數(shù)據(jù)扮演著非常核心的角色。
從數(shù)據(jù)的角度來看,大數(shù)據(jù)上一波的核心驅(qū)動主要是推薦算法,典型的應(yīng)用包括一些用戶畫像,風(fēng)險(xiǎn)控制、市場獲客等;而這一波數(shù)據(jù)的熱潮主要是以人工智能驅(qū)動,可以說數(shù)據(jù)在這一波人工智能大模型的發(fā)展中,起著非常核心的作用。“數(shù)據(jù)的規(guī)模、數(shù)據(jù)的質(zhì)量決定著大模型的上限,所以能看到數(shù)據(jù)是重中之重。”
人工智能發(fā)展對數(shù)據(jù)提出新的需求和挑戰(zhàn)
2025年以來,人工智能的發(fā)展呈現(xiàn)出一些新特征,對數(shù)據(jù)也提出了一些新需求。比如語言大模型,它的邊際效應(yīng)遞減已經(jīng)非常明顯,所以語言大模型要進(jìn)一步提高它的能力,就需要更高質(zhì)量的數(shù)據(jù)。另外一方面,除了語言大模型,越來越多的關(guān)注點(diǎn)開始轉(zhuǎn)向了多模態(tài),無論是對語言大模型的持續(xù)優(yōu)化,還是對多模態(tài)模型等數(shù)據(jù)都提出了一些新的需求、新的挑戰(zhàn)。
何寶宏指出,為了進(jìn)一步提高語言大模型的能力,就需要發(fā)展更高質(zhì)量、覆蓋范圍更廣的數(shù)據(jù)。為了提升語言大模型推理能力,圍繞推理甚至應(yīng)用如Agent等,需要結(jié)合場景和應(yīng)用等一些私域的、行業(yè)的、專有的數(shù)據(jù)。對于多模態(tài)大模型的發(fā)展來說,就不能僅僅只有文字類,還需要音頻、視頻等,這些數(shù)據(jù)如何對齊,在數(shù)據(jù)發(fā)展中也提出新的需求和挑戰(zhàn)。
數(shù)據(jù)技術(shù)正以體系化的方式發(fā)生巨大變革
在何寶宏看來,為應(yīng)對這些新需求、新挑戰(zhàn),數(shù)據(jù)技術(shù)正以體系化的方式發(fā)生巨大變革。
具體來看,一方面,現(xiàn)有數(shù)據(jù)體系需面向人工智能進(jìn)行定制化轉(zhuǎn)型與適配。以數(shù)據(jù)治理為例,以往通用的治理模式,如今需結(jié)合人工智能的專用場景進(jìn)行調(diào)整優(yōu)化;即便是已有的DataOps體系,也需要衍生出面向AI的專屬分支(DataOps For AI),重點(diǎn)推進(jìn)數(shù)據(jù)安全治理等相關(guān)工作,本質(zhì)上是現(xiàn)有數(shù)據(jù)領(lǐng)域工作向AI適配的轉(zhuǎn)型。
另一方面,人工智能的發(fā)展也催生了數(shù)據(jù)領(lǐng)域的新情況、新問題,這是以往未曾出現(xiàn)的。當(dāng)前這一波人工智能以生成式AI為核心,其生成的結(jié)果本身也屬于數(shù)據(jù)范疇。隨著近年來生成式AI的快速迭代,如今的數(shù)據(jù)格局已發(fā)生改變——人類產(chǎn)生的數(shù)據(jù)、傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)與AI合成/生成的數(shù)據(jù)日益交融,難以精準(zhǔn)區(qū)分。后續(xù),如何應(yīng)對AI合成數(shù)據(jù)帶來的挑戰(zhàn),尤其是如何規(guī)范AI合成數(shù)據(jù)在模型訓(xùn)練與迭代中的應(yīng)用,已成為數(shù)據(jù)領(lǐng)域亟待解決的新課題。
何寶宏進(jìn)一步講到:“除了數(shù)據(jù)資源層面的變化,數(shù)據(jù)技術(shù)層面也需同步迭代升級。”受上述數(shù)據(jù)資源體系變革的驅(qū)動,數(shù)據(jù)技術(shù)正迎來一系列新調(diào)整:在數(shù)據(jù)存算領(lǐng)域,宏觀層面上存算架構(gòu)逐步向分布式、存算分離的方向發(fā)展,而面向本地或就近數(shù)據(jù)處理的需求,近存計(jì)算模式也愈發(fā)重要;同時,由于數(shù)據(jù)體量激增,需根據(jù)數(shù)據(jù)“溫度”(熱數(shù)據(jù)、溫?cái)?shù)據(jù)、冷數(shù)據(jù))進(jìn)行分級存儲,對應(yīng)的存儲介質(zhì)也需隨之優(yōu)化。在數(shù)據(jù)庫技術(shù)領(lǐng)域,人工智能的發(fā)展同樣提出了新要求——隨著AI向多模態(tài)方向演進(jìn),傳統(tǒng)單模態(tài)數(shù)據(jù)庫已顯現(xiàn)出效率偏低、成本偏高的問題,因此向量數(shù)據(jù)庫、多模態(tài)數(shù)據(jù)庫成為技術(shù)升級的重要方向。
最后,何寶宏強(qiáng)調(diào),受人工智能技術(shù)發(fā)展的驅(qū)動,當(dāng)前數(shù)據(jù)技術(shù)正經(jīng)歷全方位的巨大變革,其核心目標(biāo)是實(shí)現(xiàn)數(shù)智深度融合。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
彩云之南,向新而行:解鎖數(shù)智云南新場景、新活力
)“十四五”期間,云南持續(xù)加大數(shù)字化基礎(chǔ)設(shè)施投入,積極推動行業(yè)數(shù)智化、低碳化轉(zhuǎn)型,取得了豐碩成果。[詳細(xì)]
折痕有望消滅,但折疊屏手機(jī)又添新課題?
近期,關(guān)于折疊屏手機(jī)的消息一波接一波,先是三星的三折疊機(jī)型現(xiàn)身,后是流出關(guān)于蘋果闊折疊機(jī)型的消息,不過關(guān)于折疊屏手機(jī)的技術(shù)難題,似乎還是存在。[詳細(xì)]
從規(guī)模破局到質(zhì)效突圍:5G工廠邁入量質(zhì)齊升新賽道
2025年作為“十四五”時期5G工廠“百千萬”行動收官之年,我國5G工廠建設(shè)已從起步探索邁入規(guī)模應(yīng)用新階段,1260個5G工廠納入官方名錄,累計(jì)帶動投資591.3億元,覆蓋41個工業(yè)大類、近90個行業(yè)..[詳細(xì)]
信息光子技術(shù)產(chǎn)業(yè)正加速發(fā)展,并進(jìn)入重要戰(zhàn)略機(jī)遇期
當(dāng)前,信息光子技術(shù)產(chǎn)業(yè)正加速發(fā)展,并進(jìn)入重要戰(zhàn)略機(jī)遇期。近日,中國信通院發(fā)的《信息光子技術(shù)發(fā)展與應(yīng)用研究報(bào)告(2025 年)》(以下簡稱《報(bào)告》)指出,一方面,需求側(cè)與人工智能、先進(jìn)計(jì)..[詳細(xì)]
中國信通院正式發(fā)布2026深度觀察十大趨勢
12月13日,2026中國信通院深度觀察報(bào)告會主報(bào)告會在北京舉辦。本次報(bào)告會主題為 “面向“十五五”,人工智能浪潮下的新質(zhì)生產(chǎn)力發(fā)展”。工業(yè)和信息化部黨組成員、副部長張?jiān)泼鞒鱿瘓?bào)告會并致..[詳細(xì)]












