新一代人工智能國(guó)家科技重大專項(xiàng)“藏語(yǔ)言文字自動(dòng)識(shí)別技術(shù)研發(fā)和應(yīng)用”成果介紹會(huì)29日在拉薩舉行,活動(dòng)介紹了漢藏語(yǔ)音翻譯技術(shù)與復(fù)雜場(chǎng)景藏文多風(fēng)格字體識(shí)別技術(shù)兩項(xiàng)標(biāo)志性成果,全面呈現(xiàn)了藏語(yǔ)智能信息領(lǐng)域的自主創(chuàng)新與系統(tǒng)化成果。
中國(guó)工程院院士、西藏大學(xué)教授尼瑪扎西介紹,本次項(xiàng)目圍繞藏語(yǔ)言文字自動(dòng)識(shí)別中的實(shí)際難題展開(kāi)系統(tǒng)性攻關(guān),重點(diǎn)突破多方言語(yǔ)音識(shí)別、復(fù)雜場(chǎng)景文字識(shí)別等長(zhǎng)期存在的技術(shù)瓶頸。
項(xiàng)目構(gòu)建了完整的漢藏(藏語(yǔ)多方言)語(yǔ)音翻譯技術(shù)體系,實(shí)現(xiàn)從語(yǔ)音識(shí)別、機(jī)器翻譯到語(yǔ)音合成的全流程覆蓋,提升了不同方言及復(fù)雜環(huán)境下的語(yǔ)音處理能力。同時(shí),首次研發(fā)面向復(fù)雜場(chǎng)景的藏文多風(fēng)格字體識(shí)別技術(shù),可有效處理現(xiàn)代出版物、古籍文獻(xiàn)、社交媒體圖像和自然場(chǎng)景圖片等多種來(lái)源的藏文文本,解決了字體多樣、背景復(fù)雜等識(shí)別難題。
項(xiàng)目成果已轉(zhuǎn)化到基于智能終端的(移動(dòng)操作系統(tǒng))APP、基于PC端(計(jì)算機(jī)操作系統(tǒng))的web應(yīng)用、無(wú)線藍(lán)牙漢藏語(yǔ)音翻譯耳機(jī)、無(wú)線藏語(yǔ)智能鼠標(biāo)及漢藏智能語(yǔ)音翻譯會(huì)議機(jī)五項(xiàng)核心示范產(chǎn)品。
尼瑪扎西表示,在數(shù)據(jù)資源建設(shè)方面,項(xiàng)目已建成規(guī)?;牟卣Z(yǔ)言跨模態(tài)數(shù)據(jù)資源管理系統(tǒng),包括藏漢句對(duì)1000萬(wàn)個(gè)、語(yǔ)音語(yǔ)料2000小時(shí)、圖像標(biāo)注數(shù)據(jù)20000張,以及包含18000個(gè)實(shí)體與30000余條關(guān)系的知識(shí)圖譜數(shù)據(jù),為技術(shù)的持續(xù)優(yōu)化與應(yīng)用推廣奠定了基礎(chǔ)。
記者現(xiàn)場(chǎng)獲悉,部分成果已在政府辦公、布達(dá)拉宮古籍?dāng)?shù)字化保護(hù)等重點(diǎn)場(chǎng)景中投入應(yīng)用。其中,藏漢機(jī)器翻譯系統(tǒng)單日訪問(wèn)量最高達(dá)11萬(wàn)次,藏文古籍識(shí)別軟件運(yùn)行穩(wěn)定,為社會(huì)提供了便捷可靠的藏語(yǔ)信息處理服務(wù)。
據(jù)悉,此次活動(dòng)由西藏大學(xué)主辦。
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。