更新日誌
11月21日
- 近期新增模型:gpt-4o-2024-11-20,step-2-16k,grok-vision-beta,
- 千問2.5turbo百萬上下文模型:qwen-turbo-2024-11-01
11月07日
- 相容claude 原生sdk,v1/messages介面已支援上線;
- claude原生介面的緩存和控制電腦功能還不支援(prompt caching和computer use)我們會在接下來的兩周內繼續完善。
11月05日
- 新增模型:claude-3-5-haiku-20241022
- 新增馬斯克x.ai最新模型grok-beta
10月23日
- 新增模型:claude-3-5-sonnet-20241022
10月10日
OpenAI最新的緩存功能現已上線。此功能目前支援以下模型:
- GPT-4o
- GPT-4o-mini
- o1-preview
- o1-mini
請注意,gpt-4o-2024-05-13版本不在官方支持範圍內。
如果請求命中緩存,您將能夠在後臺日誌中看到相關的緩存token資料。
更多詳細資訊和使用規則,請訪問OpenAI官方網站:OpenAI緩存功能詳情
10月03日
- gpt-4o模型後臺計費下降價格同步官方
- 新增模型:aihubmix-Llama-3-2-90B-Vision,aihubmix-Llama-3-70B-Instruct
- 新增cohere最新模型aihubmix-command-r-08-2024,aihubmix-command-r-plus-08-2024
9月19日
- 新增模型:whisper-large-v3和distil-whisper-large-v3-en
- 注意:whisper模型實際計費是按照輸入的秒數計費的,但是目前頁面價格展示有問題未來會修復,後臺底層計費沒有問題whisper-1 完全同步openai官方扣費
9月13日
- 新增模型o1-mini和o1-preview;
注:最新這兩個模型,要求傳入參數有變,一些殼軟體如果不更新預設傳入的參數會報錯;
需要注意
經測試,01 模型不支援以下內容,並報錯:
- system 欄位:400 報錯
- tools 欄位:400 報錯
- 圖片輸入:400 報錯
- json_object 輸出:500 報錯
- structured 輸出:400 報錯
- logprobs 輸出:403 報錯
- stream 輸出:400報錯
- o1系列:20 RPM,150,000,000 TPM,很低,隨時429報錯
- 其他:temperature, top_p and n 被固定為1;presence_penalty 和 frequency_penalty 被固定為 0
9月10日
- 新增模型:mattshumer/Reflection-Llama-3.1-70B;ps:據說llama3.1-70b最強微調版本
- claude-3模型價格上調調整,為了維持claude模型穩定供應,目前調用我們會比直接調用官方貴10%,後續會逐步下調;
- 增加了openai系列模型的併發能力,理論上基本支援無限併發;
8月11日
- 新增模型:Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
- 增加了Llama相關模型的 穩定性
- 進一步優化了claude模型的相容性
8月7日
- 新增openai剛剛更新4o版本gpt-4o-2024-08-06,見https://platform.openai.com/docs/guides/structured-outputs
- 新增google最新模型:gemini-1.5-pro-exp-0801
8月4日
- 增加了線上直接支付充值
- 修復了claude多輪對話格式報錯問題:1、messages: roles must alternate between "user" and "assistant", but found multiple "user" roles in a row;
- 優化了claude模型的使用function功能時index問題
- https://orisound.cn備用伺服器將在9月7日全面下線;目前在使用這個位址的請抽空改成主要伺服器https://aihubmix.com或者備用伺服器https://api.aihubmix.com
7月27日
- 新增支援Mistral Large 2,模型名稱:Mistral-large-2407或者aihubmix-Mistral-large-2407;
- 系統優化
7月24日
- 新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant;歡迎嘗試;
7月20日
- 已修復gpt-4o-mini模型在價格計算方面的問題。具體情況如下:
文本輸入價格:OpenAI官方的gpt-4o-mini模型輸入文本的價格僅為gpt-4o模型價格的1/33。
圖片輸入價格:OpenAI官方的gpt-4o-mini模型輸入圖片的價格與gpt-4o模型價格相等。 - 為了確保價格計算的準確性,我們在計算gpt-4o-mini模型輸入圖片的token數時,將其乘以33倍,以與官方價格對齊。
- 詳情可見 Open AI官方價格
7月19日
- 新增支援gpt-4o-mini模型,後臺計費同步官方
7月15日 公告
- 支持官方的api 參數 include_usage,傳入參數可返回stream模式下的usage,詳情見 官方文檔
7月14日 公告
- 新版本nextweb增加了支援調用非openai模型 調用本站非OpenAI模型
- 增加了阿裡千問模型的後臺扣費,總統調用我們的成本比調用阿裡雲官方貴10%左右
- 優化azure openai返回的輸出更好的相容了openai 介面
- 支持claude-3的tool Calling
- 增加了很多新模型,見 設置 可用模型
7月3日 公告
- 整體後臺介面進行了優化
- 日誌每條請求記錄增加了展示請求時當時的模型單價
- 增加了模型及價格頁面 模型/價格
6月20日 公告
- 最新claude-3-5-sonnet-20240620已支援,調用方法見 調用本站非open AI模型教程
6月18日 公告
- 後臺日誌頁面現在開始,支援下載使用請求記錄
6月16日 公告
- 降低了隨機到azure openai 的概率,現在幾乎很小概率會隨機到
6月13日 公告
- 下調Claude-3相關模型的費用(Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus)後臺扣費和官方一致;因此當前我們網站額度零售價格,使用我的API的成本相當於官網86折;
6月10日 公告
- 整體服務架構升級,全部伺服器和資料遷入微軟azure;
- 未來我將基於one api的開源版本項目進行二次深度開發和優化(原本我們已通過贊助獲得oneapi項目商業版授權)
- 日誌部分資料量太大(超過1億級的請求日誌)因此暫時無法遷移,如需查詢之前的老日誌請聯繫客服
- 優化gpt-4o的token計費, tokenizer的cI100k_base 改為0200k_base ,之前的gpt-4 系列用的是cI100k_base;結果就是中文、韓文、日文的流式請求的token計數會比之前下降;
6月8日 公告
- 新增阿裡最新開源模型Qinwen2
- alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct
5月20日 公告
- 新增模型gemini-1.5-flash
- 新增模型gpt-4o
- 江蘇地區進入充值頁面報錯,因為充值域名被電信劫持,請先 聯繫客服 進行充值。
- 新增llama3(llama3-70b-8192、llama3-8b-8192)gemini-1.5-pro、command-r、command-r-plus、歡迎調用嘗試
- Claude-3模型恢復供應;目前本站正在連接Claude-3部署在aws和Google cloud上的端點。
- 為了維持伺服器費用及團隊成本,Claude-3模型和價格後臺扣費比官方貴10%
- 後續調用量增加的話,會逐步下調至5%左右,甚至更低,
- 目前併發有待測試和隨著調用增加而去申請更高的併發調用。