牛牛视频在线 I 99久久综合网 I 麻豆网站视频 I 美国大妈 I 久久精品免费看 I 好吊一区二区三区 I 99热伊人网 I 天堂新版8中文在线8 I 中文字幕精品视频在线观看 I 女子spa高潮呻吟抽搐 I 国产三级黄色 I 91黄色在线观看 I 日韩精品一级 I 91福利在线免费观看 I 亚洲阿v天堂 I 热久久国产精品 I 婷婷社区五月天 I 欧美黄色免费观看 I 欧美疯狂做受 I 亚洲女人网 I 亚洲天堂2020 I 泰国性xxx视频 I 国产人成午夜免电影费观看 I jizzjizz亚洲中国少妇 I 午夜影院在线国产 I 涩涩的网站在线观看 I 91午夜看片 I 女模特又黄又爽免费视频网站 I 亚洲 欧洲 国产 精品 I 黄网大全在线观看 I 国产精品一区波多野结衣 I 精品在线观看av I 黄色免费福利视频 I 欧美a级片免费观看 I 在线观看高h无码黄动漫 I 2023精品国色卡一卡二 I 日韩在线欧美在线国产在线 I 美女被狂揉大乳视频网站 I 国产成人亚洲日韩欧美性

  1. pg下載
  2. /
  3. pg下載資訊
  4. /
  5. 行業pg下載
  6. /
  7. 王小川大模型首亮相!70億參數霸榜,清北搶先用
   作者:yuncan,發布時間:2023-06-15 14:07:57

王小川大模型首亮相!70億參數霸榜,清北搶先用

今天,百川智能正式發布70億參數開源中英文大模型——baichuan-7B,一舉拿下多個評測榜單最佳成績。

時隔兩個月,王小川組建的「百川智能」在6月15日正式推出首個70億參數中英文預訓練大模型——baichuan-7B。baichuan-7B不僅在C-Eval、AGIEval和Gaokao中文權威評測榜單上,以顯著優勢全面超過了ChatGLM-6B等其他大模型,并且在MMLU英文權威評測榜單上,大幅領先LLaMA-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平臺發布。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖

Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7B

Github:https://github.com/baichuan-inc/baichuan-7B

Model Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary

多個中文評估基準拿下7B最佳

為了驗證模型的各項能力,baichuan-7B在C-Eval、AGIEval和Gaokao三個最具影響力的中文評估基準進行了綜合評估,并且均獲得了優異成績,它已經成為同等參數規模下中文表現最優秀的原生預訓練模型。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖1

在AGIEval的評測里,baichuan-7B綜合評分達到34.4分,遠超LLaMA-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他開源模型。在中文C-EVAL的評測中,baichuan-7B的綜合評分達到了42.8分,超過了ChatGLM-6B的38.9分,甚至比某些參數規模更大的模型還要出色。在Gaokao評測中,baichuan-7B的綜合評分達到了36.2分,顯著領先于同參數規模的各種其他預訓練模型。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖2

https://cevalbenchmark.com/static/leaderboard_zh.html(2023-06-15)

AGIEval評測基準由微軟研究院發起,旨在全面評估基礎模型在人類認知和問題解決相關任務上的能力,包含了中國的高考、司法考試,以及美國的SAT、LSAT、GRE和GMAT等20個公開且嚴謹的官方入學和職業資格考試。C-Eval評測基準由上海交通大學、清華大學以及愛丁堡大學聯合創建,是面向中文語言模型的綜合考試評測集,覆蓋了52個來自不同行業領域的學科。Gaokao評測基準是復旦大學研究團隊創建的評測框架,以中國高考題目作為數據集,用于測試大模型在中文語言理解和邏輯推理能力方面的表現。

MMLU基準大幅領先LLaMA-7B

baichuan-7B不僅在中文方面表現優異,在英文上表現同樣亮眼。在MMLU的評測中baichuan-7B綜合評分高達42.5分,大幅領先英文開源預訓練模型LLaMA-7B的34.2分以及中文開源模型ChatGLM-6B的36.9分。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖3

MMLU由加州大學伯克利分校等知名高校共同打造,集合了科學、工程、數學、人文、社會科學等領域的57個科目,主要目標是對模型的英文跨學科專業能力進行深入測試。其內容廣泛,從初級水平一直涵蓋到高級專業水平。

萬億數據、4K上下文、高效穩定訓練

訓練語料對大模型的訓練結果至關重要。在構建預訓練語料庫方面,百川智能以高質量中文語料為基礎,同時融合了優質的英文數據。具體來說,原始數據包括自行抓取的海量中英文互聯網數據和部分開源的中英文數據,以及大量高質量知識性數據。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖4

在數據質量方面,通過質量模型對數據進行打分,對原始數據集進行篇章級和句子級的精確篩選。在內容多樣性方面,利用自研超大規模局部敏感哈希聚類系統和語義聚類系統,對數據進行了多層次多粒度的聚類,最終構建了包含1.2萬億token的兼顧質量和多樣性的預訓練數據。相較于其他同參數規模的開源中文預訓練模型,數據量提高了超過50%。在萬億優質中英文數據的基礎上,為了更好地提升訓練效率,baichuan-7B深度整合了模型算子來加快計算流程,并針對任務負載和集群配置,自適應優化了模型并行策略以及重計算策略。通過高效的訓練過程調度通信,baichuan-7B成功地實現了計算與通信的高效重疊,進而達到了超線性的訓練加速,在千卡集群上訓練吞吐達到180+Tflops的業界領先水平。同時,已有的開源模型窗口長度在2K以內,對于一些長文本建模任務,如需要引入外部知識做搜索增強的場景,更長的處理長度有助于模型在訓練與推理階段捕獲越多的上下文信息,2K的處理長度存在比較大的制約。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖5

經過優化的分詞算法baichuan-7B基于高效的attention算子優化實現了萬級別超長動態窗口的擴張能力,本次開源的預訓練模型開放了4K上下文窗口,使模型應用場景更加廣泛。此外,baichuan-7B還對模型訓練流程進行了深度優化,采用了更科學且穩定的訓練流程和超參數選擇,使得 baichuan-7B模型的收斂速度大大提升。與同等參數規模的模型相比,baichuan-7B在困惑度(PPL)和訓練損失(training loss)等關鍵性能指標上表現更加優秀。

王小川大模型首亮相!70億參數霸榜,清北搶先用插圖6

開源免費可商用,清北已搶先體驗

秉持開源精神,baichuan-7B代碼采用Apache-2.0協議,模型權重采用了免費商用協議,只需進行簡單登記即可免費商用。baichuan-7B此次開源的內容十分豐富,包含了推理代碼、INT4量化實現、微調代碼,以及預訓練模型的權重。其中,微調代碼方便用戶對模型進行調整和優化;推理代碼與INT4量化實現則有助于開發者低成本地進行模型的部署和應用;預訓練模型權重開源后,用戶則可以直接使用預訓練模型進行各種實驗研究。據了解,北京大學和清華大學兩所頂尖大學已率先使用baichuan-7B模型推進相關研究工作,并計劃在未來與百川智能深入合作,共同推動baichuan-7B模型的應用和發展。清華大學互聯網司法研究院院長、計算機系教授劉奕群認為, baichuan-7B模型在中文上的效果表現十分出色,它免費商用的開源方式展現出開放的態度,不僅貢獻社區,也推動技術發展。團隊計劃基于baichuan-7B模型開展司法人工智能領域的相關研究。北京大學人工智能研究院助理教授楊耀東認為,baichuan-7B模型的開源將對于中文基礎語言模型的生態建設及學術研究產生重要推動作用,同時他也表示將持續關注相關領域探索,并且在中文大語言模型的安全和對齊上進行進一步深入研究。百川智能CEO王小川表示:「本次開源模型的發布是百川智能成立2個月后的第一個里程碑,對百川智能而言是一個良好的開局。baichuan-7B模型,不僅能為中國的AGI事業添磚加瓦,也為世界大模型開源社區貢獻了新的力量。」

技術團隊專訪

Q:baichuan-7B如何處理幻覺問題,未來該如何提高結果正確性?

A:大模型在可見的未來還不能徹底解決幻覺問題,一方面通過強化學習來讓模型知道自己不知道,有效緩解幻覺,更重要的是需要靠「搜索增強」引入外部知識來逐步解決幻覺問題。

Q:baichuan-7B能帶來哪些商用價值?

A:baichuan-7B作為在多個榜單評測效果成績最佳的7B開源可商用大模型,填補了市場上缺乏優質的針對中文優化的7B大模型的空白,是開發者理想的7B大模型底座。同時在商用價值方面,能夠在例如文本生成,自動化寫作,數據分析,知識問答,中英翻譯,個性化交互和專業領域個人小助手,比如醫療領域,給用戶帶來巨大的價值。

Q:baichuan-7B在評測榜的成績達到最初的訓練模型預期了嗎?

A:打榜并不是我們的目的,我們相信好的數據和算法能力,評測自然會有好的結果,這次baichuan-7B在多個最具影響力的評測中的優異表現也驗證了百川的這個理念。

轉載自公眾號“新智元”

主站蜘蛛池模板: 久久国产成人午夜av浪潮 | 国产肥白大熟妇bbbb视频 | 欧美性生 活18~19 | 午夜国产亚洲精品一区 | 自拍偷拍 校园春色 | 永久免费精品视频 | 在熟睡夫面前侵犯我在线播放 | 无码日韩精品一区二区免费 | 无码国产精品一区二区vr | 日韩美毛片 | 四虎永久在线观看 | 黄色高潮 | 亚洲精品宾馆在线精品酒店 | 久久香蕉国产线看观看手机 | 国产精品免费看久久久8精臀av | 日本亲近相奷中文字幕 | 成人深夜视频在线观看 | 欧美aa大片| 欧美人与禽性性生活 | 国精产品一区一区三区mba下载 | 亚洲欧美洲成人一区二区三区 | 国产性夜夜春夜夜爽免费下载 | 日韩精品一卡2卡三卡4卡 | 日韩av一区二区三区在线观看 | 欧美一区二区三区综合 | 精品国产av色一区二区深夜久久 | 少妇特黄v一区二区三区图片 | 欧美三级少妇高潮 | 蜜桃精品视频在线观看 | 国产成人三级 | 久久久一本精品久久精品六六 | 亚欧洲精品视频 | 国产精品高清一区二区三区 | 日产久久久久久 | 免费看国产成人无码a片 | 不卡一不卡二不卡三 | 亚洲国产第一区 | 色综合亚洲一区二区小说 | 亚洲成人高清在线 | 尤物在线视频观看 | 国产麻豆亚洲精品一区二区 | 欧美亚洲一级 | 国产精品亚洲精品一区二区三区 | 国产免费又黄又爽又刺激蜜月al | 国产精品久久久久久亚洲伦 | 中文日韩在线视频 | 国产精品国产三级国产潘金莲 | 国产白丝jk绑缚调教网站 | 无码人妻丰满熟妇啪啪欧美 | 欧洲美女粗暴牲交免费观看 | 91九色porny国产探花 | 日本免费三片在线观看 | 九七超碰| 国产999精品2卡3卡4卡 | 国产成人精品午夜福利不卡 | 性饥渴艳妇性色生活片在线播放 | 玖玖热麻豆国产精品图片 | 亚洲爆乳精品无码一区二区三区 | 日本vs亚洲vs韩国一区三区 | 综合人妻久久一区二区精品 | 精品人伦一区二区三区蜜桃视频 | 久久大尺度 | 国产精品一线天粉嫩av | 亚洲aaaaaa| 亚洲欧美一区二区三区久久 | 亚洲免费视频网 | 久久精品一区二区 | 亚洲熟妇无码八v在线播放 色综合精品 | 成人亚洲欧美激情在线电影 | 在线播放国产精品三级 | 亚洲国产超清无码专区 | 亚洲第一区欧美国产不卡综合 | 91人人澡 | 手机在线亚洲 | 国内偷自拍性夫妇 | 苍井空浴缸大战猛男120分钟 | 午夜一级在线 | 91精品国产福利在线观看的优点 | 久久亚洲精品成人av无码网站 | 亲胸揉屁股膜下刺激视频免费网站 | 在线观看a网站 | 亚洲欧美日韩愉拍自拍 | 久久久久国产精品人妻 | 久久这里只精品热在线18 | 色婷婷5月天| 九九视频在线播放 | 久久黄色网址 | 丁香花在线观看免费观看图片 | 伊人五月天 | 伊伊色| 久久人妻无码aⅴ毛片a片app | 免费毛片在线播放 | 久久亚洲国产精品影院 | 成本人妻片无码中文字幕免费 | 久草在线视频免费资源观看 | 亚洲中文字幕aⅴ天堂自拍 亚洲vs日韩vs欧美vs久久 | 在线观看中文字幕网站 | 国产叼嘿视频在线观看 | 乱肉合集乱高h久久爱 |