• <li id="00i08"><input id="00i08"></input></li>
  • <sup id="00i08"><tbody id="00i08"></tbody></sup>
    <abbr id="00i08"></abbr>
  • 新聞中心

    EEPW首頁 > 智能計算 > 業界動態 > 聯發科推繁中大型語言模型

    聯發科推繁中大型語言模型

    作者: 時間:2023-02-27 來源:工商時報 收藏

    集團轄下的前瞻技術研究單位聯發創新基地、中央研究院詞庫小組和國家教育研究院等三方所組成的研究團隊,23日宣布推出全球第一款繁體中文語言模型到開源網站提供測試,后續將有機會持續推動具備繁體中文的人工智能(AI)市場發展。

    表示,本次公開釋出以開源語言模型BLOOM開發的繁體中文(Large language model),比目前開源可用的最大繁體中文模型大1,000倍,所使用的訓練數據也多1,000倍。該模型已公開讓外界下載,可應用于問答系統、文字編修、廣告文案生成、華語教學、客服系統等。

    聯發創新基地負責人許大山表示,是近年來人工智能技術進步的亮點,更是未來進步不可或缺的基石。此次結合中研院及國教院,成為臺灣極少數能訓練的團隊,以透明、開放和包容的方式,善用技術、人才及資源,既發展自主訓練大型人工智能模型的能力,也讓繁體中文的大型語言模型研究及應用更為普及。

    開放原始碼釋出的大型語言模型,目前多數仍以英文為主要優化的對象,繁體中文的語言模型相對不足。有鑒于開放原始碼繁體中文大型語言模型的重要性與迫切性,在2022年5月,聯發創新基地、中央研究院和國家教育研究院展開合作計劃,使用大型語言模型BLOOM的繁體中文模型再訓練與優化。

    目前開放系列中第一個有量級跳躍意義的繁體中文語言模型,聯發創新基地也暫備一個手機網頁接口,供研究者試用。

    為建立該項語言模型,國家教育研究院提供了大量高質量的繁體中文語料,作為主要的訓練材料。聯發創新基地則建置了訓練的硬件環境,制訂各種符合國際標準的繁體中文評量指標,收集更近期的語料,并對模型進行能更有效讀懂使用者的指示(prompt)的特別訓練。


    評論


    相關推薦

    技術專區

    關閉
    主站蜘蛛池模板: 汾西县| 健康| 安塞县| 灌阳县| 堆龙德庆县| 萨嘎县| 松溪县| 金沙县| 新余市| 讷河市| 福建省| 门头沟区| 铜梁县| 抚州市| 新乡市| 屏边| 河北省| 宜川县| 赤峰市| 许昌市| 聂拉木县| 紫云| 新平| 芮城县| 亚东县| 治县。| 大庆市| 襄城县| 盐池县| 沂源县| 儋州市| 吴忠市| 清涧县| 晋州市| 辽源市| 临江市| 大安市| 合川市| 巴青县| 陆河县| 辽中县|