跳到主要内容

更新日誌

11月21日

近期新增模型：gpt-4o-2024-11-20，step-2-16k，grok-vision-beta，
千問2.5turbo百萬上下文模型：qwen-turbo-2024-11-01

11月07日

相容claude 原生sdk，v1/messages介面已支援上線；
claude原生介面的緩存和控制電腦功能還不支援（prompt caching和computer use）我們會在接下來的兩周內繼續完善。

11月05日

新增模型：claude-3-5-haiku-20241022
新增馬斯克x.ai最新模型grok-beta

10月23日

新增模型：claude-3-5-sonnet-20241022

10月10日

OpenAI最新的緩存功能現已上線。此功能目前支援以下模型：

GPT-4o
GPT-4o-mini
o1-preview
o1-mini

請注意，gpt-4o-2024-05-13版本不在官方支持範圍內。

如果請求命中緩存，您將能夠在後臺日誌中看到相關的緩存token資料。

更多詳細資訊和使用規則，請訪問OpenAI官方網站：OpenAI緩存功能詳情

10月03日

gpt-4o模型後臺計費下降價格同步官方
新增模型：aihubmix-Llama-3-2-90B-Vision，aihubmix-Llama-3-70B-Instruct
新增cohere最新模型aihubmix-command-r-08-2024，aihubmix-command-r-plus-08-2024

9月19日

新增模型：whisper-large-v3和distil-whisper-large-v3-en
注意：whisper模型實際計費是按照輸入的秒數計費的，但是目前頁面價格展示有問題未來會修復，後臺底層計費沒有問題whisper-1 完全同步openai官方扣費

9月13日

新增模型o1-mini和o1-preview；
注：最新這兩個模型，要求傳入參數有變，一些殼軟體如果不更新預設傳入的參數會報錯;

需要注意

經測試，01 模型不支援以下內容，並報錯：

system 欄位：400 報錯
tools 欄位：400 報錯
圖片輸入：400 報錯
json_object 輸出：500 報錯
structured 輸出：400 報錯
logprobs 輸出：403 報錯
stream 輸出：400報錯
o1系列：20 RPM，150,000,000 TPM，很低，隨時429報錯
其他：temperature, top_p and n 被固定為1；presence_penalty 和 frequency_penalty 被固定為 0

9月10日

新增模型：mattshumer/Reflection-Llama-3.1-70B；ps：據說llama3.1-70b最強微調版本
claude-3模型價格上調調整，為了維持claude模型穩定供應，目前調用我們會比直接調用官方貴10%，後續會逐步下調；
增加了openai系列模型的併發能力，理論上基本支援無限併發；

8月11日

新增模型：Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
增加了Llama相關模型的穩定性
進一步優化了claude模型的相容性

8月7日

新增openai剛剛更新4o版本gpt-4o-2024-08-06，見https://platform.openai.com/docs/guides/structured-outputs
新增google最新模型：gemini-1.5-pro-exp-0801

8月4日

增加了線上直接支付充值
修復了claude多輪對話格式報錯問題：1、messages: roles must alternate between "user" and "assistant", but found multiple "user" roles in a row；
優化了claude模型的使用function功能時index問題
https://orisound.cn備用伺服器將在9月7日全面下線；目前在使用這個位址的請抽空改成主要伺服器https://aihubmix.com或者備用伺服器https://api.aihubmix.com

7月27日

新增支援Mistral Large 2，模型名稱：Mistral-large-2407或者aihubmix-Mistral-large-2407；
系統優化

7月24日

新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant；歡迎嘗試；

7月20日

已修復gpt-4o-mini模型在價格計算方面的問題。具體情況如下：
文本輸入價格：OpenAI官方的gpt-4o-mini模型輸入文本的價格僅為gpt-4o模型價格的1/33。
圖片輸入價格：OpenAI官方的gpt-4o-mini模型輸入圖片的價格與gpt-4o模型價格相等。
為了確保價格計算的準確性，我們在計算gpt-4o-mini模型輸入圖片的token數時，將其乘以33倍，以與官方價格對齊。
詳情可見 Open AI官方價格

7月19日

新增支援gpt-4o-mini模型，後臺計費同步官方

7月15日公告

支持官方的api 參數 include_usage，傳入參數可返回stream模式下的usage，詳情見 官方文檔

7月14日公告

新版本nextweb增加了支援調用非openai模型 調用本站非OpenAI模型
增加了阿裡千問模型的後臺扣費，總統調用我們的成本比調用阿裡雲官方貴10%左右
優化azure openai返回的輸出更好的相容了openai 介面
支持claude-3的tool Calling
增加了很多新模型，見設置可用模型

7月3日公告

整體後臺介面進行了優化
日誌每條請求記錄增加了展示請求時當時的模型單價
增加了模型及價格頁面 模型/價格

6月20日公告

最新claude-3-5-sonnet-20240620已支援，調用方法見 調用本站非open AI模型教程

6月18日公告

後臺日誌頁面現在開始，支援下載使用請求記錄

6月16日公告

降低了隨機到azure openai 的概率，現在幾乎很小概率會隨機到

6月13日公告

下調Claude-3相關模型的費用（Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus）後臺扣費和官方一致；因此當前我們網站額度零售價格，使用我的API的成本相當於官網86折；

6月10日公告

整體服務架構升級，全部伺服器和資料遷入微軟azure；
未來我將基於one api的開源版本項目進行二次深度開發和優化（原本我們已通過贊助獲得oneapi項目商業版授權）
日誌部分資料量太大（超過1億級的請求日誌）因此暫時無法遷移，如需查詢之前的老日誌請聯繫客服
優化gpt-4o的token計費， tokenizer的cI100k_base 改為0200k_base ，之前的gpt-4 系列用的是cI100k_base；結果就是中文、韓文、日文的流式請求的token計數會比之前下降；

6月8日公告

新增阿裡最新開源模型Qinwen2
alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct

5月20日公告

新增模型gemini-1.5-flash
新增模型gpt-4o
江蘇地區進入充值頁面報錯，因為充值域名被電信劫持，請先 聯繫客服 進行充值。
新增llama3（llama3-70b-8192、llama3-8b-8192）gemini-1.5-pro、command-r、command-r-plus、歡迎調用嘗試
Claude-3模型恢復供應；目前本站正在連接Claude-3部署在aws和Google cloud上的端點。
為了維持伺服器費用及團隊成本，Claude-3模型和價格後臺扣費比官方貴10%
後續調用量增加的話，會逐步下調至5%左右，甚至更低，
目前併發有待測試和隨著調用增加而去申請更高的併發調用。