阿里云通義千問發(fā)布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長上下文

AI ? 2024年6月7日 16:26:00 ? AI

今日，阿里云通義千問（Qwen）宣布，經(jīng)過數(shù)月的持續(xù)研發(fā)和優(yōu)化，其AI開源模型系列已升級至Qwen2，并在Hugging Face和ModelScope上同步開源。此次升級不僅引入了五個尺寸的預訓練和指令微調(diào)模型，還在多項性能上實現(xiàn)了顯著提升，包括代碼和數(shù)學能力的增強，以及對更長上下文長度的支持。

Qwen2系列包括五個不同尺寸的模型：Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B，這些模型在參數(shù)量、非Embedding參數(shù)量以及上下文長度上均有所不同，以滿足不同場景下的需求。特別值得一提的是，Qwen2-72B-Instruct模型的上下文長度支持最高達到了128K tokens，為用戶提供了更加廣闊的文本處理空間。

在訓練數(shù)據(jù)方面，Qwen2系列在中文和英語的基礎上，增加了27種語言相關的高質(zhì)量數(shù)據(jù)，從而大幅提升了模型的多語言能力。同時，所有尺寸的模型都采用了GQA（Gradient-based Quantization Aware Training）技術，該技術能夠顯著加速推理過程并降低顯存占用，為用戶提供更加高效和穩(wěn)定的模型使用體驗。

在模型評測方面，Qwen2系列在大規(guī)模模型上實現(xiàn)了非常大幅度的效果提升。尤其是Qwen2-72B模型，在包括自然語言理解、知識、代碼、數(shù)學及多語言等多項能力上均顯著超越當前領先的模型，如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。這一成果充分展示了Qwen2系列在AI模型研發(fā)領域的領先地位和強大實力。

阿里云通義千問作為阿里云旗下的AI開源項目，一直致力于推動AI技術的創(chuàng)新和發(fā)展。此次Qwen2系列的發(fā)布，不僅為用戶提供了更加先進和高效的AI模型，也進一步彰顯了阿里云在AI領域的技術實力和創(chuàng)新能力。未來，我們期待通義千問能夠繼續(xù)推出更多優(yōu)秀的AI模型和技術，為AI領域的發(fā)展貢獻更多的力量。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/659662.html

Qwen2 通義千問阿里云阿里云通義千問

AI認證作者

0 0

出海

全球公有云平臺Wave評估報告發(fā)布阿里云全球排名第二

近日，全球權威研究機構Forrester發(fā)布了其最新的公有云平臺Wave評估報告，全面評估了全球主要公有云廠商的技術能力與戰(zhàn)略布局。根據(jù)評估結果，阿里云與亞馬遜AWS、微軟Azur…

科技探索者
2024年12月4日
出海

阿里云發(fā)布全新國際生態(tài)伙伴計劃，激勵合作伙伴推動技術創(chuàng)新

昨日，阿里云正式對外宣布了全新國際生態(tài)伙伴計劃，旨在攜手全球合作伙伴共同推動云計算和人工智能技術的創(chuàng)新與發(fā)展。據(jù)悉，該計劃出臺了一系列激勵政策，以吸引更多的技術伙伴加入。其中，阿…

李小白
2024年12月4日
新聞

阿里云加大香港市場投入，推出“香港科技創(chuàng)未來”計劃

昨日，阿里云宣布將加大香港市場投入，推出“香港科技創(chuàng)未來”計劃。并增強對本土企業(yè)和上臺伙伴的AI技術支持和人才培育。作為香港排名第一的云計算IaaS服務提供商，阿里云營收保持雙位…

李森
2024年11月28日
商業(yè)

阿里集團CEO吳泳銘：AI最大的想象力在于改變物理世界

阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘：“?過去22個月，AI發(fā)展速度超過任何歷史時期，但我們依然還處于AGI變革的早期。生成式AI最大的想象力，絕不是在手機屏幕上做一兩個新的超級app，而是接管數(shù)字世界，改變物理世界?！?/p>

藍鯊硬科技
2024年9月21日
AI

阿里通義千問開源Qwen2-Audio 7B：無需文本自由對話

近日，阿里巴巴通義千問團隊宣布開源了其最新的音頻語言模型Qwen2-Audio系列，包括Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct兩個版本。這一大…

AI
2024年8月13日
AI

阿里云開源大模型Qwen2-72B登頂Hugging Face新排行榜

近日，人工智能領域傳來喜訊，阿里巴巴集團開源的通義千問（Qwen）指令微調(diào)模型Qwen2-72B在Hugging Face公布的全新開源大語言模型排行榜上榮登榜首，成功超越Meta…

AI
2024年6月30日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費，加速AI應用普及

在人工智能領域的激烈競爭中，百度文心大模型近日宣布了一項重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費開放使用，即刻生效。這一舉措無疑將對整個行業(yè)產(chǎn)…

百度
2024年5月21日
AI

阿里云發(fā)布通義千問2.5大模型，能力全面升級，趕超GPT-4

昨日，在阿里云AI智領者峰會-北京站活動中，阿里云正式發(fā)布了通義千問2.5大模型，并宣稱其在多項能力上已全面趕超GPT-4，尤其在中文語境下的表現(xiàn)尤為突出。據(jù)阿里云官方介紹，通義…

科技新聞
2024年5月10日
AI

阿里云通義千問開源320億參數(shù)大語言模型，全系列已達七款

4月7日，阿里云宣布通義千問成功開源其最新的320億參數(shù)大語言模型——Qwen1.5-32B，至此通義千問已完成包括5億、18億、40億、70億、140億和720億參數(shù)在內(nèi)的全系列…

科技新聞
2024年4月8日
AI

阿里云啟用AI編程助手通義靈碼，助力程序員提升效率

近日，阿里云在內(nèi)部全面推行AI編程，借助通義靈碼這一智能編程助手，幫助程序員編寫代碼、閱讀代碼、檢查BUG以及優(yōu)化代碼等工作。這一創(chuàng)新舉措標志著阿里云在智能化編程領域邁出了重要的一…

泡沫大盜
2024年4月3日
AI

阿里云通義千問加速追趕GPT-4 引領智能時代新革命

近日，阿里巴巴集團CEO、阿里云智能董事長吳泳銘在《中國網(wǎng)信雜志》發(fā)表文章，深入探討了通義千問作為國內(nèi)基礎大模型的代表之一，正積極追趕國際先進水平的GPT-4，并致力于將基礎大模型…

AI
2024年3月11日
AI

阿里云通義千問多模態(tài)大模型Qwen-VL-Max重磅升級

阿里云昨日公布了其多模態(tài)大模型研究的新進展，推出了升級版的通義千問視覺理解模型Qwen-VL-Max。這款模型在視覺推理能力和中文理解能力上都有了顯著提升，性能表現(xiàn)堪比GPT-4V…

若安丶
2024年1月27日
新聞

阿里云宣布通義千問720億參數(shù)模型開源

今日，阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio，目前已上線阿里魔搭社區(qū)。

秋秋
2023年12月1日
新聞

阿里巴巴：吳泳銘接替張勇，阿里云智能集團分拆計劃繼續(xù)進行

阿里巴巴宣布吳泳銘先生將接替張勇先生出任阿里云智能集團代理董事長兼首席執(zhí)行官，委任于 2023 年 9 月 10 日生效

科技探索者
2023年9月11日
張勇發(fā)全員信：阿里云將分拆上市

阿里巴巴宣布啟動「1+6+N」組織變革以來，首個正式宣布「單飛」的業(yè)務落子阿里云智能集團

蘋果派
新聞 2023年5月19日
阿里云域名價格調(diào)整 2月1日起net英文域名續(xù)費上調(diào)至89元

據(jù)阿里云官網(wǎng)顯示，阿里云日前發(fā)布域名價格調(diào)整通知。

若安丶
新聞 2023年1月16日
阿里巴巴組織架構大調(diào)整集團CEO張勇兼任阿里云智能總裁

昨日，阿里巴巴集團董事會主席兼CEO張勇發(fā)出全員郵件，宣布組織變化，并將新年關鍵字定為“進”。

若安丶
新聞 2022年12月30日
阿里云正式發(fā)布“汽車云”：已服務國內(nèi)超70%汽車企業(yè)

阿里云“汽車云”在 2022云棲大會上正式亮相。目前，阿里云“汽車云”在國內(nèi)已服務超過70%的汽車企業(yè)，小鵬、一汽、吉利、長城、長安、地平線等均已上云。

若安丶
智車 2022年11月7日
阿里云：2022云棲大會，11月3-5日杭州見

阿里云宣布，2022杭州·云棲大會將在11月3日至5日杭州·云棲小鎮(zhèn)舉行。

若安丶
新聞 2022年9月30日
阿里云獲評MongoDB年度新興市場最佳云合作伙伴

阿里云獲評MongoDB年度新興市場最佳云合作伙伴

蘋果派
新聞 2022年6月15日

發(fā)表回復

登錄后才能評論

阿里云通義千問發(fā)布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長上下文

相關推薦

發(fā)表回復