月之暗面Kimi開放平臺推出上下文緩存公測，大幅降低長文本模型成本

AI ? 2024年7月2日 11:09:00 ? AI

今日，月之暗面正式對外宣布，其Kimi開放平臺上線了全新的上下文緩存（Context Caching）功能，并即日起開啟公測。這一創(chuàng)新技術(shù)旨在不增加API價格負擔(dān)的前提下，為開發(fā)者提供最高可達90%的成本降低，并顯著提升模型響應(yīng)速度，標(biāo)志著人工智能服務(wù)效率與成本控制的新突破。

據(jù)官方介紹，上下文緩存是一種先進的數(shù)據(jù)管理技術(shù)，它通過預(yù)先存儲頻繁請求的大量數(shù)據(jù)或信息，顯著減少了對原始數(shù)據(jù)源的重復(fù)計算與檢索需求。當(dāng)用戶再次請求相同信息時，系統(tǒng)能夠迅速從緩存中調(diào)取，從而大幅降低處理時間和成本。對于依賴長文本模型進行高頻查詢的應(yīng)用場景而言，這一技術(shù)無疑是一大利好。

Kimi開放平臺指出，上下文緩存功能特別適用于以下業(yè)務(wù)場景：提供大量預(yù)設(shè)內(nèi)容的問答機器人（如Kimi API小助手）、針對固定文檔集合的頻繁查詢工具（如上市公司信息披露問答系統(tǒng)）、靜態(tài)代碼庫或知識庫的周期性分析應(yīng)用（如各類Copilot Agent），以及瞬時流量巨大的AI爆款應(yīng)用（如哄哄模擬器、LLM Riddles）等。官方數(shù)據(jù)顯示，啟用上下文緩存后，首Token延遲可降低83%，為用戶帶來前所未有的高效體驗。

在計費方面，Kimi開放平臺采取了靈活且透明的收費模式，包括Cache創(chuàng)建費用、Cache存儲費用和Cache調(diào)用費用三部分。具體而言，Cache創(chuàng)建費用按實際Tokens量計費，每百萬Tokens收費24元；Cache存儲費用則按分鐘收取，每百萬Tokens每分鐘收費10元；而Cache調(diào)用費用則分為增量Token費用和調(diào)用次數(shù)費用，前者按模型原價收費，后者則按每次調(diào)用0.02元的標(biāo)準(zhǔn)收取。

值得注意的是，此次公測活動將持續(xù)3個月，期間價格可能根據(jù)市場反饋進行調(diào)整。此外，公測資格將優(yōu)先開放給Tier5等級用戶，其他用戶的開放時間將另行通知。這一舉措既體現(xiàn)了月之暗面對高質(zhì)量用戶的重視，也為廣大開發(fā)者提供了一個提前體驗并反饋寶貴意見的機會。

隨著人工智能技術(shù)的不斷發(fā)展，如何在保證服務(wù)質(zhì)量的同時有效控制成本，成為眾多開發(fā)者和企業(yè)關(guān)注的焦點。月之暗面Kimi開放平臺此次推出的上下文緩存功能，無疑為這一難題提供了有效的解決方案，有望推動人工智能服務(wù)的普及與應(yīng)用場景的拓展。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/664692.html

Kimi 上下文緩存月之暗面

AI認證作者

0 0

AI

月之暗面發(fā)布k1視覺思考模型，支持多領(lǐng)域圖像理解

今日，人工智能公司月之暗面宣布發(fā)布其最新的k1視覺思考模型。該模型基于強化學(xué)習(xí)技術(shù)，不僅在數(shù)學(xué)領(lǐng)域表現(xiàn)突出，還擴展到了物理、化學(xué)等基礎(chǔ)科學(xué)領(lǐng)域，展現(xiàn)出強大的圖像理解和思維鏈能力。 …

AI
2024年12月16日
AI

月之暗面出海遇阻：Kimi賺錢難題下新模型k0-math能否破局

近日，月之暗面創(chuàng)始人楊植麟，發(fā)布了一款名為k0-math的數(shù)學(xué)模型，主打深入思考。值得關(guān)注的是，其公司現(xiàn)在正面臨一個大問題：怎么賺錢？特別是他們的C端工具Kimi，雖然投放了不少廣…

AI
2024年11月27日
AI

Kimi探索版上線：AI自主搜索能力大幅提升，搜索量增10倍

今日，月之暗面正式發(fā)布了Kimi探索版，這款新版本在AI自主搜索能力上實現(xiàn)了重大突破。據(jù)官方介紹，Kimi探索版的搜索量相比普通版增強了10倍，一次搜索即可精讀500個頁面，為用戶…

AI
2024年10月11日
商業(yè)

AI大模型公司月之暗面再獲投資，估值飆升至30億美元

在人工智能領(lǐng)域，一家名為月之暗面（Moonshot）的大模型公司正受到業(yè)界的廣泛關(guān)注。最新消息顯示，該公司的融資進程仍在持續(xù)進行，最新一輪的估值報價已達到驚人的30億美元（約合21…

商業(yè)頭條
2024年5月21日
AI

Kimi智能助手全新升級，新增多項AI輔助功能

近日，備受用戶青睞的Kimi智能助手宣布了其節(jié)后首次重大更新，推出了全新的Kimi+助手功能。該功能不僅為用戶提供了更為便捷的AI輔助服務(wù)，還在多個領(lǐng)域展現(xiàn)了強大的應(yīng)用潛力，預(yù)示著…

AI
2024年5月7日
AI

創(chuàng)業(yè)公司Kimi大模型產(chǎn)品火爆出圈，能否持續(xù)引領(lǐng)AI新趨勢？

近日，一家僅成立一年的創(chuàng)業(yè)公司憑借一款效果出眾的大模型產(chǎn)品Kimi，在AI領(lǐng)域掀起了一股新的波瀾。這款面向C端用戶的智能助手以其獨特的長文本處理能力和多場景應(yīng)用功能，贏得了市場的廣…

AI
2024年4月24日
AI

月之暗面Kimi智能助手升級，新增語音交互與搜索溯源功能

近日，月之暗面公司宣布旗下Kimi智能助手的基礎(chǔ)模型已更新至moonshot-v1-20240416版本，此次更新不僅提升了模型能力，還新增了多項實用功能，為用戶帶來更加便捷和智能…

AI
2024年4月19日
AI

國產(chǎn)AI大模型Kimi實現(xiàn)技術(shù)突破，領(lǐng)先海外產(chǎn)品

在人工智能領(lǐng)域，國產(chǎn)AI大模型Kimi近日宣布取得重大技術(shù)突破，將上下文無損輸入長度提升至200萬字，這一成就標(biāo)志著國內(nèi)大模型在部分能力上首次超越海外主流產(chǎn)品，成為業(yè)界的里程碑事件…

AI
2024年4月3日
AI

AI助手大比拼：Kimi vs GPT-4 vs Claude-3誰更勝一籌？

在數(shù)字化時代，AI助手已成為我們?nèi)粘Ｉ詈凸ぷ髦胁豢苫蛉钡囊徊糠帧imi、GPT-4和Claude-3等AI助手各有特色，它們在處理不同任務(wù)時表現(xiàn)出不同的優(yōu)勢和局限。本文將全面對…

AI
2024年4月2日
AI

突然火了！Kimi是什么？哪些AI+相關(guān)標(biāo)的或受益？

3月20日，AI應(yīng)用主線爆發(fā)。數(shù)據(jù)顯示，Sora概念、多模態(tài)AI、虛擬數(shù)字人等AI應(yīng)用類板塊大漲，Kimi概念掀起漲停潮，其中華策影視、海天瑞聲“20CM”漲停。當(dāng)日下午，“Ki…

百度
2024年3月29日
AI

Kimi Chat使用技巧：掌握這些步驟，讓智能聊天更順暢！

Kimi Chat是一款智能聊天機器人，可以提供各種信息和幫助。本文將介紹Kimi Chat使用技巧以及它的優(yōu)點和缺點。一、Kimi Chat使用步驟打開Kimi Chat應(yīng)用…

AI
2024年3月26日
AI

Kimi是什么？揭秘AI助手及其用途與用法

在人工智能技術(shù)的快速發(fā)展中，一款名為Kimi的智能助手近期引起了廣泛關(guān)注。Kimi智能助手憑借其強大的功能和便捷的用法，成為用戶在學(xué)術(shù)、工作、生活等多方面的得力助手。那么Kimi是…

AI
2024年3月26日
AI

Kimi大模型爆火每天獲客成本或超20萬元

目前Kimi投放廣告的獲客成本約在10元，如果算上拉新后用戶問答互動產(chǎn)生的算力成本，每個用戶的獲客成本達到12-13元

科技探索者
2024年3月26日
新聞

蘋果Apple從App Store下架熱門盜版電影應(yīng)用 Kimi

近日，蘋果Apple公司從其官方應(yīng)用商店App Store下架了一款名為Kimi的熱門應(yīng)用。這款應(yīng)用因其提供非法盜版電影內(nèi)容而受到關(guān)注，其中包括了如《芭比娃娃》和《奧本海默》等熱門…

檸萌
2024年2月14日