清華與字節跳動推出大語言模型 支持多語言 具備多種能力
2023-08-24 19:52:06 來源:中關村在線
(相關資料圖)
近日,清華大學電子工程系與字節跳動火山語音團隊聯合推出一款名為SALMONN的開源大語言模型。該模型支持語音、音頻以及音樂輸入,能夠感知和理解不同類型的音頻內容輸入,并具備多語言語音識別和翻譯以及語音推理等功能。據官方介紹,SALMONN目前能夠勝任英語語音識別、英語到中文的語音翻譯、情感識別、音頻字幕生成、音樂描述等重要的語音和音頻任務。同時,該模型還展現出多種在模型訓練中沒有專門學習過的多語言和跨模態能力,包括非英語語音識別、英語到(中文以外)其他語言的語音翻譯、對語音內容的摘要和關鍵詞提取、基于音頻的故事生成、音頻問答、語音和音頻聯合推理等任務。目前,SALMONN已經在GitHub上發布,官方也提供了項目的演示鏈接,供感興趣的人前往了解。
關鍵詞:
相關文章
精彩推送
遠興能源(000683.SZ):阿拉善天然堿項目一期工程2號鍋爐已點火,第二條生產線擬于近期擇機投料試車
格隆匯8月23日丨有投資者向遠興能源(000683 SZ)提問,“請問阿拉善項目
來源:格隆匯
