更新日誌
11月21日
- 近期新增模型:gpt-4o-2024-11-20,step-2-16k,grok-vision-beta,
- 千問2.5turbo百萬上下文模型:qwen-turbo-2024-11-01
11月07日
- 相容claude 原生sdk,v1/messages介面已支援上線;
- claude原生介面的緩存和控制電腦功能還不支援(prompt caching和computer use)我們會在接下來的兩周內繼續完善。
11月05日
- 新增模型:claude-3-5-haiku-20241022
- 新增馬斯克x.ai最新模型grok-beta
10月23日
- 新增模型:claude-3-5-sonnet-20241022
10月10日
OpenAI最新的緩存功能現已上線。此功能目前支援以下模型:
- GPT-4o
- GPT-4o-mini
- o1-preview
- o1-mini
請注意,gpt-4o-2024-05-13版本不在官方支持範圍內。
如果請求命中緩存,您將能夠在後臺日誌中看到相關的緩存token資料。
更多詳細資訊和使用規則,請訪問OpenAI官方網站:OpenAI緩存功能詳情
10月03日
- gpt-4o模型後臺計費下降價格同步官方
- 新增模型:aihubmix-Llama-3-2-90B-Vision,aihubmix-Llama-3-70B-Instruct
- 新增cohere最新模型aihubmix-command-r-08-2024,aihubmix-command-r-plus-08-2024
9月19日
- 新增模型:whisper-large-v3和distil-whisper-large-v3-en
- 注意:whisper模型實際計費是按照輸入的秒數計費的,但是目前頁面價格展示有問題未來會修復,後臺底層計費沒有問題whisper-1 完全同步openai官方扣費
9月13日
- 新增模型o1-mini和o1-preview;
注:最新這兩個模型,要求傳入參數有變,一些殼軟體如果 不更新預設傳入的參數會報錯;
需要注意
經測試,01 模型不支援以下內容,並報錯:
- system 欄位:400 報錯
- tools 欄位:400 報錯
- 圖片輸入:400 報錯
- json_object 輸出:500 報錯
- structured 輸出:400 報錯
- logprobs 輸出:403 報錯
- stream 輸出:400報錯
- o1系列:20 RPM,150,000,000 TPM,很低,隨時429報錯
- 其他:temperature, top_p and n 被固定為1;presence_penalty 和 frequency_penalty 被固定為 0
9月10日
- 新增模型:mattshumer/Reflection-Llama-3.1-70B;ps:據說llama3.1-70b最強微調版本
- claude-3模型價格上調調整,為了維持claude模型穩定供應,目前調用我們會比直接調用官方貴10%,後續會逐步下調;
- 增加了openai系列模型的併發能力,理論上基本支援無限併發;
8月11日
- 新增模型:Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
- 增加了Llama相關模型的穩定性
- 進一步優化了claude模型的相容性
8月7日
- 新增openai剛剛更新4o版本gpt-4o-2024-08-06,見https://platform.openai.com/docs/guides/structured-outputs
- 新增google最新模型:gemini-1.5-pro-exp-0801
8月4日
- 增加了線上直接支付充值
- 修復了claude多輪對話格式報錯問題:1、messages: roles must alternate between "user" and "assistant", but found multiple "user" roles in a row;
- 優化了claude模型的使用function功能時index問題
- https://orisound.cn備用伺服器將在9月7日全面下線;目前在使用這個位址的請抽空改成主要伺服器https://aihubmix.com或者備用伺服器https://api.aihubmix.com
7月27日
- 新增支援Mistral Large 2,模型名稱:Mistral-large-2407或者aihubmix-Mistral-large-2407;
- 系統優化
7月24日
- 新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant;歡迎嘗試;
7月20日
- 已修復gpt-4o-mini模型在價格計算方面的問題。具體情況如下:
文本輸入價格:OpenAI官方的gpt-4o-mini模型輸入文本的價格僅為gpt-4o模型價格的1/33。
圖片輸入價格:OpenAI官方的gpt-4o-mini模型輸入圖片的價格與gpt-4o模型價格相等。 - 為了確保價格計算的準確性,我們在計算gpt-4o-mini模型輸入圖片的token數時,將其乘以33倍,以與官方價格對齊。
- 詳情可見 Open AI官方價格
7月19日
- 新增支援gpt-4o-mini模型,後臺計費同步官方
7月15日 公告
- 支持官方的api 參數 include_usage,傳入參數可返回stream模式下的usage,詳情見 官方文檔