來源:中國經濟網-經濟日報 發布時間:2022-5-27 10:21
一臺可以書寫的智能交互機械臂,用毛筆寫下“一起向未來”;一部多足行走機器人和一部跳舞機器人,共同跳起了一段舞蹈,隨后,跳舞機器人還單獨進行了一段武術表演,抱拳開臂,馬步弓步,一招一式憨態可掬。這是記者在北京聲智科技有限公司(以下稱“聲智科技”)展廳里看到的景象。
聲智科技成立于2016年,專注于聲學前沿技術和人工智能領域,主要面向數智健康、數智城市等場景提供產品和解決方案。憑借持續創新研發,聲智科技獲得了吳文俊人工智能科學技術獎、北京市科技進步二等獎等多個獎項。
突破技術難點
“聲智科技是從研發遠場語音交互技術起步的,你剛才看到的那幾個機器人搭載了聲智科技研發的智能語音交互技術。”聲智科技創始人陳孝良說,隨著物聯網技術的普及,語音成為人機交互的新入口,支持遠場語音交互的產品市場潛力很大。
“遠場語音識別技術面臨諸多研發難點,比如環境噪聲、人聲、房間混響的干擾等。若采用常規語音處理方法,會導致信號失真和資源消耗大,使得語音識別技術準確率低,應用困難。”陳孝良說。
憑借深厚技術積累和持續研發,聲智科技先后攻克了多項遠場語音交互關鍵技術,包括回聲抵消技術、噪聲消除技術、聲源定位技術、語音識別技術等。如今,這些技術已應用于一些消費級電子產品中,聲智科技也成為國內不少知名企業的合作伙伴。
“我們意識到,伴隨著人工智能的快速發展,人機交互、協同過程中的多數問題,都不能靠單一技術解決,需要將語音、圖像識別、大數據等技術結合起來。只有推進多模態、多技能的融合,才能實現更多場景的應用。”聲智科技副總裁李良斌說。
他介紹,聲智科技的做法是,用“多模態”確保機器具有“聲、光、電、熱、力、磁”多種感知技術;用“遠場”解決機器在遠距離場域中對多模態信號的分析;用“多技能”賦予智能系統多種能力,通過多技能相互協同,完成復雜任務。
基于這種技術理念,聲智科技研發推出核心技術產品——壹元人工智能開發框架。基于這個框架,聲智科技融合了遠場聲光、多模態識別等多項技術,圍繞智慧社區、智慧交通、智慧辦公、智慧醫院等應用場景,提供AI產品及解決方案。
截至目前,聲智科技已經參與了50余項國家行業標準的制定,擁有國內專利2000余項。在2020年前,聲智科技總融資金額超過3億元。陳孝良說,這些融資全部投入到核心技術的持續研發上。
助力智慧防疫
新冠肺炎疫情暴發以來,聲智科技自主研發的技術產品,用于多地的防疫服務中。
記者剛走進中關村前沿技術創新中心的一樓大廳,就聽到清脆的聲音:“您現在的體溫是36.5攝氏度,沒有發熱癥狀”。聲音來自一臺測溫機器人,在機器人顯示屏上,除了實時顯示被檢測者的紅外熱成像信息和溫度值,還能查看全國疫情數據,測溫精度在正負0.2攝氏度。
聲智科技首席知識官常樂介紹,這個測溫機器人可在幾秒鐘內完成1米至6米范圍內多個目標的高精度測溫,支持實時AI語音合成播報,自動上傳預警信息。目前,該機器人已在北京、廣州、青島、成都等地落地使用。
“小易小易,上樓”“小易小易,去10樓”,在北京海淀醫院的電梯里,只需要一句簡單的指令,就能實現乘梯上下樓,全程免按鍵,實現零接觸。
“聲智科技研發的智慧語音電梯,融合語音與圖像等交互技術,不依賴手機、IC卡等設備,無論使用者是在電梯外,還是在電梯轎廂內,都可以通過可視化人機交互方式搭乘電梯。”常樂介紹,這方便了老人、兒童等用戶的日常生活,在疫情防控期間還有效降低了接觸傳播感染風險。
目前,聲智科技已推出第二代AI智能電梯系統,增加手勢識別功能,殘障人士也可以實現免接觸控制電梯。2021年,為解決電動自行車入戶充電的監管難題,減少電池充電爆炸起火等隱患,企業又迭代推出了第三代AI智能電梯。
“未來,我們希望AI技術能滿足復雜場景的靈活、大范圍應用。”李良斌表示,聲智科技將繼續加強核心技術研發,讓更多AI產品落地,使萬物互聯更智能。