5月25日,中電信人工智能科技有限公司&中國電信人工智能研究院(以下簡稱“人工智能公司”)在2024智算云生態(tài)大會(huì)全方位展示了在人工智能領(lǐng)域的最新技術(shù)成果和創(chuàng)新實(shí)力,讓觀眾身臨其境地感受到中國電信天翼AI的技術(shù)魅力和品牌力量。
作為推進(jìn)新質(zhì)生產(chǎn)力發(fā)展的關(guān)鍵代表性技術(shù),AI目前已經(jīng)成為全球科技創(chuàng)新主體爭相角逐的焦點(diǎn)。大會(huì)主論壇上,人工智能公司總經(jīng)理何忠江介紹了星辰大模型向多模態(tài)通用智能升級(jí)的階段性成果,并展示了自主研發(fā)升級(jí)的星辰語音大模型及星辰視覺大模型,彰顯了中國電信在人工智能領(lǐng)域的又一次重大突破。
星辰語音大模型,支持30多種方言識(shí)別
有沒有能聽得懂方言的智能客服?星辰語音大模型給出了肯定的答案。本次大會(huì)重磅亮相的星辰語音大模型,是由人工智能公司自主研發(fā)的業(yè)內(nèi)首個(gè)支持30種方言自由混說的強(qiáng)大引擎。得益于“蒸餾+膨脹”聯(lián)合訓(xùn)練算法、超大規(guī)模語音預(yù)訓(xùn)練和多方言聯(lián)合建模,星辰超多方言語音識(shí)別大模型能夠同時(shí)識(shí)別和理解包括粵語、上海話、四川話、溫州話等在內(nèi)的多種方言,打破了傳統(tǒng)語音識(shí)別系統(tǒng)通常僅適用于特定方言的局限。
何忠江介紹,人工智能公司的研發(fā)團(tuán)隊(duì)構(gòu)建了一個(gè)超過30種方言、30萬小時(shí)以上的高質(zhì)量方言數(shù)據(jù)庫,該系統(tǒng)不僅大大降低了推理時(shí)的語音傳輸比特率,而且讓溝通更加自然流暢,解決了老年人及“老少邊窮”地區(qū)信息服務(wù)無法觸達(dá)的問題,架起了通往AI時(shí)代的溝通橋梁。他表示,發(fā)布會(huì)后,語音大模型的算法代碼和訓(xùn)練代碼將面向社會(huì)全部開源開放,希望業(yè)界同仁能夠用中國電信的大模型底座發(fā)揮更好的商業(yè)價(jià)值和學(xué)術(shù)價(jià)值,跟大家一起共建中國方言的AI體系,使方言數(shù)字化、AI化,讓方言不要消失在歷史的長河中。
星辰視覺大模型,從感知智能邁向認(rèn)知智能
人工智能公司發(fā)布的TeleSearch視覺大模型同樣引發(fā)業(yè)界關(guān)注。TeleSearch是星辰視覺大模型最新3.0版本,它構(gòu)建了面向千種場景的新一代大規(guī)模視頻AI解析系統(tǒng),通過整合多源跨模態(tài)信息,實(shí)現(xiàn)了精準(zhǔn)的跨模態(tài)理解。它解決了數(shù)據(jù)采集難、算法精度低、任務(wù)碎片化、開發(fā)周期長等行業(yè)痛點(diǎn),突破了小模型樣本采集、模型訓(xùn)練、精度對齊的傳統(tǒng)流程,助力解決長尾小模型難題。
何忠江介紹,星辰視覺大模通過高維空間文本信息和像素信息分割和對齊,實(shí)現(xiàn)了視頻中的萬事萬物均可通過自然語言檢索。它采用了自然語言化的算法,能夠?qū)崿F(xiàn)零樣本即時(shí)定制,建立了分鐘級(jí)迭代的新一代大規(guī)模視頻AI自學(xué)習(xí)閉環(huán)體系,這一顛覆傳統(tǒng)模式的體系使得處理任意定制需求及規(guī)?;l(fā)展成為可能。與此同時(shí),該框架結(jié)合了大模型、向量檢索和模型量化等技術(shù),支持億級(jí)規(guī)模的文搜圖、圖搜圖的檢索匹配。它還支持標(biāo)注、訓(xùn)練、推理的一體化操作,聚焦“一句話布控”和“萬物檢索”兩種核心業(yè)務(wù),端到端地解決“尋人找物”“安全生產(chǎn)”“合規(guī)督查”等業(yè)務(wù)場景難題,實(shí)現(xiàn)了一鍵式部署,無門檻使用,為千行百業(yè)賦能。
更多AI軟硬件產(chǎn)品集中亮相
在展館中,中國電信星辰語音、語義、視覺、多模態(tài)大模型等創(chuàng)新技術(shù)悉數(shù)亮相,為觀眾帶來了深刻的體驗(yàn)。觀眾可以現(xiàn)場體驗(yàn)到AI生成的“簪花寫真”,感受福建非遺文化“簪花”在天翼AI大模型賦能下煥發(fā)的新魅力。人工智能公司還提出了一種大模型驅(qū)動(dòng)的異構(gòu)智能體協(xié)同控制算法框架——大模型智能體,其賦予了異構(gòu)智能體系統(tǒng)高層語義理解、技能認(rèn)知和復(fù)雜任務(wù)執(zhí)行的能力。在此基礎(chǔ)上,人工智能公司還將大模型智能體搭載了離線大模型,開發(fā)出了大模型離線智能導(dǎo)盲犬,實(shí)現(xiàn)了智能人機(jī)交互、智能乘梯引導(dǎo)、智能過街引導(dǎo)和智能室內(nèi)引導(dǎo)等功能,全方位為觀眾展示了離線具身智能范式的可行性和潛力。
同時(shí),更多AI應(yīng)用集中展示了人工智能公司的自研實(shí)力。其中包括:能夠智能對話的數(shù)字人系統(tǒng),集視頻接入、解析、管理、應(yīng)用于一體的星辰大模型一體機(jī);可應(yīng)用于校園內(nèi)、園區(qū)內(nèi)等多元場景的星辰語音大模型一體機(jī);為客戶提供一站式的數(shù)據(jù)服務(wù)和應(yīng)用解決方案的星海大數(shù)據(jù)AI融合平臺(tái);還有星辰大模型平臺(tái)體驗(yàn)、星辰慧記、AIGC文創(chuàng)、AI智能聽力機(jī)等諸多產(chǎn)品,用前沿科研能力賦能千百行業(yè)。
人工智能公司肩負(fù)時(shí)代使命責(zé)任,緊跟國家重大戰(zhàn)略方向,積極開展“人工智能+”行動(dòng),強(qiáng)化關(guān)鍵技術(shù)自主研發(fā),不斷夯實(shí)AI核心基礎(chǔ)能力和生態(tài)建設(shè),致力于為用戶帶來更加智能便捷的服務(wù)體驗(yàn),同時(shí)也為加快數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展、全面推進(jìn)數(shù)字中國建設(shè)貢獻(xiàn)“電信力量”。