人民網
人民網>>四川頻道>>綜合欄目>>政商動態

數據標注“國家隊”落子成都 AI+四川方言創新應用發布

王凡
2025年03月26日16:20 | 來源:人民網-四川頻道
小字號

日前,成都市國家數據標注基地牧山園區正式開園,標志著我國西南地區在數據要素市場化配置和產業數字化轉型領域邁出關鍵一步。中國電信四川公司作為聯合建設單位,發布系列AI+四川方言創新應用,聚焦數據標注、數據服務、人工智能、可信數據空間等領域,助力打造國家級數據標注試點基地。

以標注為支點,撬動AI賦能千行百業

作為全國首批數據標注基地建設城市之一,成都2024年8月便啟動了牧山園區建設項目。建設過程中,四川電信為基地配備通用數據標注工具和AI智能標注工具,支持圖像、視頻、音頻、文本、點雲等多模態數據標注。通用工具涵蓋語音轉錄、實體關系標注、2D/3D框標注等基礎功能﹔AI工具則依托大語言模型實現目標自動檢測、ASR自動化標注等智能功能,大幅提升標注效率與質量。

開園儀式

開園活動現場。四川電信供圖

在人工智能應用和數據流通領域,基地提供標訓推一體化能力,預置近200種算法模型、多個行業數據集,支持第三方能力接入和對話式交互構建應用。依托區塊鏈、隱私計算等新技術,基地打造高質量數據集流通市場,提供統一交易門戶和全流程業務支持,覆蓋從審核上架到交付結算的完整鏈條,有效促進數據價值變現。

“以文旅為例,基地融合運營商數據與智慧城市等數據,打通了從數據生產到應用的全鏈路。”基地相關負責人表示,目前,智慧消防、AI伴游、數字孿生、數字文創等文旅園區服務能力已在多個文旅平台實現應用。

從鄉音到AI:一場方言數據的文化解碼行動

當前,AI技術深度融入日常生活。為了讓AI聽懂四川方言,更好地服務廣大群眾,四川電信採用自研技術,研發方言發音詞典,並聯合成都市國家數據標注基地牧山園區,基於已採集的19個地市方言語音大數據,構建四川方言高質量數據集。“多模態四川方言語言保護”項目,更是入選GSMA全球移動通信系統協會“運營商實踐AI大模型賦能垂直行業標杆案例集”。

依托方言數據集,四川電信首創“蒸餾+膨脹”聯合訓練算法,重磅發布四川方言大模型,全面實現四川方言的識別、合成等功能。“AI+政務服務熱線”就是基於方言大模型的應用實踐:通過智能填單系統自動解析熱線會話內容,提升客服坐席效率﹔輿情監測引擎實時捕捉苗頭性事件,實現輿情的預警、預防﹔結合工單智能分析技術,自動提煉民生熱點問題並生成可視化報告,助力政府部門精准識別高頻訴求、優化公共資源配置。

此外,四川方言大模型還在醫療、文化旅游、直播助農等領域得到了成功應用。例如,和華西醫院共同研發的智慧隨訪系統,通過AI賦能,高效解決患者出院后健康監測、病情跟蹤及個性化康復指導問題,提升醫療服務質量與效率。

夯實數字底座,打造數據樞紐與要素服務高地

在人工智能迅速發展的今天,四川電信加快算力基礎設施建設和智算布局,在川形成“2+5+21+X”算力體系,為全省提供雲邊端協同、算存運融合的一體化算網調度、一站式智算服務。牧山園區建設中,該公司依托覆蓋全省的“天翼雲”資源池,為園區內AI模型訓練、數據標注等高算力需求場景提供堅實保障。

可信數據空間新津節點

揭牌儀式現場。四川電信供圖

除算力以外,四川電信持續推進“人工智能+”行動,建成AI能力平台,具備覆蓋大小模型、標訓推測評的全鏈條生產能力,並向各行業提供自主可控、開源開放、版本豐富的模型服務﹔落地部署具有數據廣泛可接入、跨域使用可控制、流通動態可監測等能力的可信數據空間平台,解決數據提供方、使用方、服務方、監管方等主體間的安全與信任問題,確保數據在跨領域、跨行業、多場景下的流通利用全流程可信可控。本次園區內落地的“可信數據空間新津節點”就是四川電信促進數據要素市場健康發展的一次生動實踐。

(責編:李強強、高紅霞)

分享讓更多人看到

返回頂部