識別率超75% AI聽懂你的聲音
清晨的地鐵站,人來人往。林女士又一次下意識地放慢腳步,低頭假裝看手機,與迎面走來的同事擦肩而過。這個看似尋常的早晨,對她而言卻是一場無聲的考驗。
“以前上班路上,遠遠看到同事走過來,我第一反應就是繞道。”林女士回憶道,手指不自覺地摩挲著衣角,“不是不想打招呼,是怕自己發(fā)音不準,對方聽不懂,也怕對方那種困惑的眼神。”
作為一名聽障人士,林女士從小佩戴助聽器,但在嘈雜環(huán)境中依然“聽不清”。更讓她困擾的是,長期缺乏語音練習讓她陷入“不敢說、怕說錯”的循環(huán)。她坦言,過去的生活像被困在一座“現(xiàn)代孤島”——就醫(yī)需要家人陪同,社交活動能推則推。
就在林女士幾乎要習慣這種孤獨時,轉(zhuǎn)機悄然而至。今年年中,通過當?shù)貧埪?lián),她第一次接觸到了中國移動開發(fā)的“中移無障礙”小程序。這個看似普通的手機應用,帶領她開始了一段全新的語音康復之旅。
“第一次使用,系統(tǒng)讓我讀幾句話,識別率只有30%左右。”林女士說這話時,眼中卻帶著光,“但它不像人那樣會不耐煩,反而每次都會鼓勵我。”這個小程序通過AI技術分析她的發(fā)音問題,精準指出聲母、韻母的偏差,并通過波形圖對比,讓她第一次“看見”了自己的聲音與標準音的差距。

用戶的發(fā)音評分情況
隨著使用次數(shù)的增加,系統(tǒng)會根據(jù)她的語音數(shù)據(jù),逐步訓練出“專屬語音識別模型”,這個為她量身定制的AI助手,不僅用于日常訓練,還能在實際溝通中,將她不清晰的語音實時轉(zhuǎn)寫成文字,讓對方一目了然。
“以前去醫(yī)院都得家人陪著,現(xiàn)在我自己去也沒問題了。”林女士笑著展示手機界面:當她說“掛號”,屏幕上準確識別并顯示出“掛號”二字。“這種感覺,像是終于有了一座橋,連接起了我和外面的世界。”
這些改變是如何發(fā)生的?“我們不僅是在做一款產(chǎn)品,更是在做一種陪伴。”中國移動互聯(lián)網(wǎng)公司產(chǎn)品負責人給出了答案。原來,得益于中國移動遍布全國的智算中心和自研的發(fā)音質(zhì)量評估算法,系統(tǒng)能夠分析每位用戶的發(fā)音弱點,針對性收集語音數(shù)據(jù)。

用戶參加語音素材收集活動
研發(fā)團隊通過深入理解聽障群體發(fā)音的差異性,用AI技術識別歸納出20余種常見構音障礙類型,進行專項問題突破。“僅需傳統(tǒng)方法三分之一的訓練樣本量,就能構建出個性化專屬模型。”目前,模型平均識別率從初期不足30%提升至75%以上,部分用戶接近90%。此外,研發(fā)團隊還將個人專屬模型壓縮至百兆級別,使其輕松運行在普通手機上,大大降低了使用門檻,讓更多人受益。
記者看到,目前該方案已集成至中國移動“5G新通話”,在通話中就可實現(xiàn)毫秒級語音轉(zhuǎn)文字,借助“5G消息”識別對話場景智能生成快捷回復;在社交、就醫(yī)等現(xiàn)場溝通場景中,“面對面助手”提供著精準的轉(zhuǎn)寫支持。
中國移動互聯(lián)網(wǎng)公司產(chǎn)品負責人的感悟尤為深刻:“科技向善的意義,不僅僅是幫助聽障群體,同時也是激發(fā)我們這些科技創(chuàng)新工作者人性之中向善的一面。雙向奔赴的力量,才能喚醒大模型的力量。”
如今,在地鐵站里,林女士不再躲避同事。她開始主動微笑、打招呼,甚至參與工作討論。“雖然發(fā)音還不完美,但我知道,我在進步。”她說這話時,聲音里透著從未有過的從容,“而這份進步,背后是科技帶來的底氣。”
在這個每一聲“你好”都值得被聽見的時代,技術正悄然成為那座無聲的橋——它不只是一串串代碼和算法,更是貫通聽與說的紐帶,連接你與我的橋梁,讓曾經(jīng)被困在孤島上的心靈,重新融入世界的對話。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創(chuàng)新亮點..[詳細]
輕薄機型出師未捷身先死,長使業(yè)績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內(nèi)容解禁,一個顯眼的標題也隨之出現(xiàn),那就是“注定停產(chǎn)”。輕薄機型的出現(xiàn)一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數(shù)據(jù)。這些不是科幻,而是剛剛在無錫物博會上發(fā)布的《2025全球..[詳細]
智能IP廣域網(wǎng)成為筑牢智算產(chǎn)業(yè)發(fā)展根基的關鍵一環(huán)
隨著國家加速推動智算產(chǎn)業(yè)高質(zhì)量發(fā)展,網(wǎng)絡支撐能力已成為產(chǎn)業(yè)進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網(wǎng),正憑借其在算力調(diào)度、數(shù)據(jù)傳輸中的核心作用,成為筑牢智算產(chǎn)業(yè)發(fā)展根基的..[詳細]
大中華區(qū)市場失守 蘋果寄望AI驅(qū)動未來增長
蘋果公司公布的2025 財年第四季度財報呈現(xiàn)“冰火兩重天”態(tài)勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區(qū)卻成..[詳細]













