深圳市北科瑞聲科技股份有限公司董事長劉軼
深圳商報記者 涂競玉 文/圖
從高校教師到企業家,劉軼的夢想一直沒變,就是致力于將人工智能技術與行業結合落地,帶動國家人工智能行業的發展。2014年暫別校園后,他創辦了北科瑞聲。經過多年的努力,北科瑞聲目前已經成長為智能音頻領域的領軍企業。
【資料圖】
在接受記者專訪時,劉軼說,未來會繼續在智慧醫療、數字政務、智能交通等領域拓展更多與音頻相關的創新應用場景。“用人工智能賦能行業發展,為科技自立自強貢獻力量,這是我作為一個科技工作者的初心。”
受阻發音場景下,實現語音實時處理
自香港科技大學博士畢業后,劉軼先后在香港科技大學、清華大學、北京大學等高校任教,培養過很多優秀的畢業生,擔任過國家第一批科技創新創業輔導師。“這些學術研究上的經歷雖然還算豐富,但是對于自己來說,我在音頻領域已經深耕了十余年,如何把核心技術轉化為產品,并帶動國家人工智能行業的發展,這才是我一直以來的夢想。”劉軼說。
帶著這個夢想,他離開了“三尺講臺”,創辦了北科瑞聲,致力于將人工智能技術在行業落地。
談及印象最深刻的經歷,劉軼說,那是2020年1月,北科瑞聲在國際上首次突破穿戴防護設備和多層口罩場景下特殊語音實時處理技術難題,實現全程非接觸語音操控,研發了非接觸智能語音HIS系統。
2022年以來,為了積極探索人工智能在智慧醫院場景下的創新應用,北科瑞聲基于自研的語音交互、5G通信和生成式預訓練(GPT)模型技術,推出了語音智慧醫院系統。該系統能夠實現診療過程全流程智能化管理,通過融合多模態智能語音交互技術,突破了以HIS為代表的復雜行業信息系統中人機交互的效率瓶頸,實現了人、物、信息的全要素閉環管理。
值得一提的是,多年來,通過不斷的科研攻關,北科瑞聲目前已經擁有全鏈條核心自主知識產權,申請發明專利百余項,并作為主要單位參與了兩項國家標準(智能語音識別和交互)制定,參與編制《人工智能倫理治理標準化指南》《中國人工智能開源軟件發展白皮書》。
深耕智能音頻,突破“卡脖子”問題
在科技工作者心中,“美”是什么?劉軼認為,美是高度的智慧和技術能力的表現,是科技工作者們不斷探索和創新的結果,是科技創新所帶來的改變和進步。“美又是一項具體的使命,如何用科技的力量讓我們的生活和社會更美好,我認為,智能語音交互技術就能做到。”
近期,劉軼帶領團隊構建了語音交互的云端大型模型方向(包括AIGC語音生成,與GPT 結合的語音交互等)、面向芯片的語音交互小模型方向、秒級指數級AI自進化能力。在音頻信息感知、語音識別、人機交互等方向構建了全鏈多模態人工智能核心技術棧。重點在一“大”、一“小”以及AI自進化領域形成技術壁壘。具體來看,“大”是指擁有中文大規模預訓練模型,超過100億級參數;“小”是指擁有芯片級小型神經網絡模型,百萬級參數;AI自進化能力擁有秒級指數級自主學習能力。
據了解,北科瑞聲團隊基于存算一體芯片的智能語音交互系統,片上計算核心實現10mW以下超低運行功耗,性能功耗比20GOPS/W以上,使用全國產制程工藝,可實現在線任務重構。代替進口美國公司的同類產品,解決高能效終端智能語音芯片“卡脖子”問題。
在行業應用方面,北科瑞聲正通過人工智能模型和系統的行業化定制,在智慧醫療、智能高速交通和數字政企領域打造系列軟硬一體化產品,構建云端芯全鏈核心產品架構,實現了國產化平臺適配,從而實現了智能語音系統全鏈自主可控運行。
“選定賽道,不斷奔跑”是劉軼奮斗的目標。他說,隨著ChatGPT的出現以及火爆,自然語音語言處理領域的技術和應用正在不斷進步和發展。“下一步,我們會繼續在智慧醫療、數字政務、智能交通等領域拓展更多的創新應用場景。我們將繼續深耕智能音頻領域,積極承擔國家級項目建設,積極解決更多‘卡脖子’難題。用人工智能技術賦能行業發展,實現人工智能技術真正落地應用。同時我們也會結合最新最熱的技術,持續迭代產品,提升企業的創新能力,為數字經濟建設貢獻人工智能力量。”