1.痛點問題
擬人化的智能體,在人類生活中開始起到越來越重要的輔助工作、提升生產(chǎn)力和情感交流等作用。具體形式包括實體化的機器人和虛擬的數(shù)字人形象兩種形式。
在實體化的機器人技術中,由于各行業(yè)場景范圍的多樣性,移動機器人的避障問題是阻礙機器人廣泛應用的一大痛點。
(1)基于視覺信息和深度強化學習來解決移動機器人避障問題,會因為仿真數(shù)據(jù)與真實數(shù)據(jù)的較大差別而導致泛化性能不足,使得真實場景下的避障的成功率下降。
(2)目前避障問題中的深度強化學習往往需要針對不同復雜程度的場景重新訓練或者再訓練模型,難以訓練出適用各種密度場景的通用模型。
(3)基于雷達的深度強化學習避障方法受限于成本、功耗和仿真的難度等,往往使用單線雷達。但單線雷達僅能對某個固定的平面進行檢測,如果移動機器人具有較高的高度,只對某個平面檢測無法實現(xiàn)完美的避障。
此外,隨著虛擬形象在金融、文旅、醫(yī)療、零售等領域的推廣與應用,數(shù)字虛擬形象產(chǎn)業(yè)應用路線逐漸清晰,但仍存在產(chǎn)業(yè)鏈相對割裂、產(chǎn)品與需求匹配度低、生產(chǎn)成本高效率低、虛擬形象交互能力弱的問題。
2.解決方案
針對現(xiàn)有技術存在的問題,本成果的解決方案從兩方面入手。首先,在移動機器人避障方面,本成果設計了一種同時結合單線雷達與單目相機的避障方法框架,并設計了新的更有效的深度強化學習模型。其次,本成果還提供一種虛擬形象說話視頻生成方法及系統(tǒng),使用深度學習方法,基于訓練好的深度神經(jīng)網(wǎng)絡語音模型,對預設音頻文件進行預測處理,通過在說話視頻生成過程中引入三維人臉信息,并結合神經(jīng)網(wǎng)絡模型生成頭部姿勢自然轉動且具有個性化說話習慣的說話視頻。上述算法可搭載于通用硬件平臺,構建低成本高效的虛擬形象視頻生成系統(tǒng)。
基于以上科研成果,本項目將致力于國民經(jīng)濟各主流行業(yè)的數(shù)字化轉型,在人工智能、機器學習、計算機視覺技術等領域持續(xù)積累智能場景應用創(chuàng)新技術,結合優(yōu)秀的前沿技術整合與應用開發(fā)融合能力和深厚的市場推廣能力,全力打造智能巡檢/服務/協(xié)作機器人和虛擬人平臺等軟硬件一體化解決方案。以實體機器人并搭載虛擬說話人虛體,通過實體、虛體相結合的方式打造獨一無二、具有全新體驗的智能巡檢/服務/協(xié)作機器人,提高智能巡檢/服務/協(xié)作過程中交互的效率與質量。
合作需求
尋求在清潔能源、儲能、新能源等行業(yè)智能運維部門和相關企業(yè)合作,對相關技術進行推廣應用,在清潔能源、儲能、新能源等行業(yè)中部署巡檢/服務/協(xié)作機器人以及虛擬人服務平臺,打造無人值守范例,賦能智能化運維,共同推動行業(yè)進步。
本成果可以用于國民經(jīng)濟開展數(shù)字化轉型的各主流行業(yè),為這些行業(yè)提供智能巡檢/服務/協(xié)作機器人以及虛擬人平臺,通過實體、虛體相結合的方式提高機器人巡檢過程交互的效率與質量。未來10年伴隨著國家對于碳達峰及碳中和的承諾,將帶來在清潔能源、儲能、新能源等行業(yè)數(shù)萬億規(guī)模的市場機會,為了推動行業(yè)發(fā)展,這類行業(yè)數(shù)字化轉型帶來的市場機會將超過萬億級。
現(xiàn)階段,國民經(jīng)濟各主流行業(yè)紛紛開展數(shù)字化轉型,“雙碳”市場蓬勃發(fā)展,以電網(wǎng)系統(tǒng)為例,面對行業(yè)智能化轉型要求,智能化運維需求迫切。針對行業(yè)痛點,本項目擬開發(fā)巡檢/服務/協(xié)作機器人和虛擬人服務平臺,通過研發(fā)實體機器人并搭載虛擬說話人虛體,通過實體、虛體相結合的方式賦能行業(yè)智能化運維,以微服務化模式實現(xiàn)產(chǎn)品敏捷化迭代,持續(xù)提升市場影響力。
本成果在虛擬形象上的競爭優(yōu)勢:
(1)通用性強:本成果所提出系統(tǒng)可搭載于通用硬件平臺,與通用的機器人平臺結合度高、可擴展性強;
(2)與專業(yè)場景的需求匹配度高:輸入語音可根據(jù)不同場景設定,專有知識適應能力強;
(3)生產(chǎn)成本低效率高:用戶在系統(tǒng)上傳一段十秒左右的視頻,就能快速生成一個可被語音驅動的自定義虛擬說話人,對輸入視頻的要求降低,同時將生成視頻的時間由原始的幾天壓縮至幾分鐘,效率大大提升;
(4)交互能力強:實現(xiàn)輸入任意一段普通話語音,能自動地合成該用戶與語音同步的說話視頻,并包含自然的頭部運動,模擬用戶與虛擬形象的交互過程。
移動機器人避障競爭優(yōu)勢:
(1)在性能方面,本成果的技術路線可以使得機器人避障效率明顯高于單獨的單線雷達,同時本成果的深度強化學習模型準確率更高,對不同密度環(huán)境的適應性更好;
(2)在成本方面,本成果所設計的傳感器方案成本遠低于使用多線雷達傳感器的方案。
掃碼關注,查看更多科技成果