新華社:百度文心一言智商超越 ChatGPT 3.5,綜合排名中國第一
新華社研究院中國企業發展研究中心最近對主流大型模型產品進行體驗評估,並發布了《人工智能大型模型體驗報告》。其中百度文心一言在中國AI大模型產品中綜合排名第一,在基本能力、智商、情商和工作效率方面均名列前茅。其中,在智商測試部分,百度文心一言更表現優異,超越了ChatGPT 3.5,僅次於 GPT4。
此次評估選擇了四個維度(基本能力、智商測試、情商測試和工作效率提升能力),36 個子能力和總計 300 道問題,對目前的主流大型模型產品進行評測。同時,該研究所還邀請了相關專家組成評估團隊,深入分析每個產品的語義理解、知識儲備和邏輯能力,最終獲得每個制造商大型模型的綜合指數評估。
綜合評價結果顯示:ChatGPT 系列模型的指標優異,ChatGPT 4.0 版本的能力在 3.5 版本的基礎上有所提升。百度開發的人工智能大型模型文心一言是中國自主開發的優勢產品之一。其他大模型產品在基本能力方面表現也很好,但面對更複雜的工作內容或情感智商環境仍有不同程度的改進空間。
資料來源:https://www.gamingdeputy.com/xinhua-news-agency-baidu-wenxin-yiyan-ranks-first-in-china-with-an-iq-exceeding-chatgpt-3-5-fast-technology-technology-changes-the-future/