跳到主要内容

更新日誌

11月21日

  • 近期新增模型:gpt-4o-2024-11-20,step-2-16k,grok-vision-beta,
  • 千問2.5turbo百萬上下文模型:qwen-turbo-2024-11-01

11月07日

  • 相容claude 原生sdk,v1/messages介面已支援上線;
  • claude原生介面的緩存和控制電腦功能還不支援(prompt caching和computer use)我們會在接下來的兩周內繼續完善。

11月05日

  • 新增模型:claude-3-5-haiku-20241022
  • 新增馬斯克x.ai最新模型grok-beta

10月23日

  • 新增模型:claude-3-5-sonnet-20241022

10月10日

OpenAI最新的緩存功能現已上線。此功能目前支援以下模型:

  • GPT-4o
  • GPT-4o-mini
  • o1-preview
  • o1-mini

請注意,gpt-4o-2024-05-13版本不在官方支持範圍內。

如果請求命中緩存,您將能夠在後臺日誌中看到相關的緩存token資料。

更多詳細資訊和使用規則,請訪問OpenAI官方網站:OpenAI緩存功能詳情

10月03日

  • gpt-4o模型後臺計費下降價格同步官方
  • 新增模型:aihubmix-Llama-3-2-90B-Vision,aihubmix-Llama-3-70B-Instruct
  • 新增cohere最新模型aihubmix-command-r-08-2024,aihubmix-command-r-plus-08-2024

9月19日

  • 新增模型:whisper-large-v3和distil-whisper-large-v3-en
  • 注意:whisper模型實際計費是按照輸入的秒數計費的,但是目前頁面價格展示有問題未來會修復,後臺底層計費沒有問題whisper-1 完全同步openai官方扣費

9月13日

  • 新增模型o1-mini和o1-preview;
    注:最新這兩個模型,要求傳入參數有變,一些殼軟體如果不更新預設傳入的參數會報錯;

需要注意

經測試,01 模型不支援以下內容,並報錯:

  • system 欄位:400 報錯
  • tools 欄位:400 報錯
  • 圖片輸入:400 報錯
  • json_object 輸出:500 報錯
  • structured 輸出:400 報錯
  • logprobs 輸出:403 報錯
  • stream 輸出:400報錯
  • o1系列:20 RPM,150,000,000 TPM,很低,隨時429報錯
  • 其他:temperature, top_p and n 被固定為1;presence_penalty 和 frequency_penalty 被固定為 0

9月10日

  • 新增模型:mattshumer/Reflection-Llama-3.1-70B;ps:據說llama3.1-70b最強微調版本
  • claude-3模型價格上調調整,為了維持claude模型穩定供應,目前調用我們會比直接調用官方貴10%,後續會逐步下調;
  • 增加了openai系列模型的併發能力,理論上基本支援無限併發;

8月11日

  • 新增模型:Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
  • 增加了Llama相關模型的穩定性
  • 進一步優化了claude模型的相容性

8月7日

8月4日

7月27日

  • 新增支援Mistral Large 2,模型名稱:Mistral-large-2407或者aihubmix-Mistral-large-2407;
  • 系統優化

7月24日

  • 新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant;歡迎嘗試;

7月20日

  • 已修復gpt-4o-mini模型在價格計算方面的問題。具體情況如下:
    文本輸入價格:OpenAI官方的gpt-4o-mini模型輸入文本的價格僅為gpt-4o模型價格的1/33。
    圖片輸入價格:OpenAI官方的gpt-4o-mini模型輸入圖片的價格與gpt-4o模型價格相等。
  • 為了確保價格計算的準確性,我們在計算gpt-4o-mini模型輸入圖片的token數時,將其乘以33倍,以與官方價格對齊。
  • 詳情可見 Open AI官方價格
    圖片
    圖片

7月19日

  • 新增支援gpt-4o-mini模型,後臺計費同步官方

7月15日 公告

  • 支持官方的api 參數 include_usage,傳入參數可返回stream模式下的usage,詳情見 官方文檔

7月14日 公告

  • 新版本nextweb增加了支援調用非openai模型 調用本站非OpenAI模型
  • 增加了阿裡千問模型的後臺扣費,總統調用我們的成本比調用阿裡雲官方貴10%左右
  • 優化azure openai返回的輸出更好的相容了openai 介面
  • 支持claude-3的tool Calling
  • 增加了很多新模型,見 設置 可用模型

7月3日 公告

  • 整體後臺介面進行了優化
  • 日誌每條請求記錄增加了展示請求時當時的模型單價
  • 增加了模型及價格頁面 模型/價格

6月20日 公告

6月18日 公告

  • 後臺日誌頁面現在開始,支援下載使用請求記錄

6月16日 公告

  • 降低了隨機到azure openai 的概率,現在幾乎很小概率會隨機到

6月13日 公告

  • 下調Claude-3相關模型的費用(Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus)後臺扣費和官方一致;因此當前我們網站額度零售價格,使用我的API的成本相當於官網86折;

6月10日 公告

  • 整體服務架構升級,全部伺服器和資料遷入微軟azure;
  • 未來我將基於one api的開源版本項目進行二次深度開發和優化(原本我們已通過贊助獲得oneapi項目商業版授權)
  • 日誌部分資料量太大(超過1億級的請求日誌)因此暫時無法遷移,如需查詢之前的老日誌請聯繫客服
  • 優化gpt-4o的token計費, tokenizer的cI100k_base 改為0200k_base ,之前的gpt-4 系列用的是cI100k_base;結果就是中文、韓文、日文的流式請求的token計數會比之前下降;

6月8日 公告

  • 新增阿裡最新開源模型Qinwen2
  • alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct

5月20日 公告

  • 新增模型gemini-1.5-flash
  • 新增模型gpt-4o
  • 江蘇地區進入充值頁面報錯,因為充值域名被電信劫持,請先 聯繫客服 進行充值。
  • 新增llama3(llama3-70b-8192、llama3-8b-8192)gemini-1.5-pro、command-r、command-r-plus、歡迎調用嘗試
  • Claude-3模型恢復供應;目前本站正在連接Claude-3部署在aws和Google cloud上的端點。
  • 為了維持伺服器費用及團隊成本,Claude-3模型和價格後臺扣費比官方貴10%
  • 後續調用量增加的話,會逐步下調至5%左右,甚至更低,
  • 目前併發有待測試和隨著調用增加而去申請更高的併發調用。