Skip to main content

更新日志

11月07日

  • 兼容claude 原生sdk,v1/messages接口已支持上线;
  • claude原生接口的缓存和控制计算机功能还不支持(prompt caching和computer use)我们会在接下来的两周内继续完善。

11月05日

  • 新增模型:claude-3-5-haiku-20241022
  • 新增马斯克x.ai最新模型grok-beta

10月23日

  • 新增模型:claude-3-5-sonnet-20241022

10月10日

OpenAI最新的缓存功能现已上线。此功能目前支持以下模型:

  • GPT-4o
  • GPT-4o-mini
  • o1-preview
  • o1-mini

请注意,gpt-4o-2024-05-13版本不在官方支持范围内。

如果请求命中缓存,您将能够在后台日志中看到相关的缓存token数据。

更多详细信息和使用规则,请访问OpenAI官方网站:OpenAI缓存功能详情

10月03日

  • gpt-4o模型后台计费下降价格同步官方
  • 新增模型:aihubmix-Llama-3-2-90B-Vision,aihubmix-Llama-3-70B-Instruct
  • 新增cohere最新模型aihubmix-command-r-08-2024,aihubmix-command-r-plus-08-2024

9月19日

  • 新增模型:whisper-large-v3和distil-whisper-large-v3-en
  • 注意:whisper模型实际计费是按照输入的秒数计费的,但是目前页面价格展示有问题未来会修复,后台底层计费没有问题whisper-1 完全同步openai官方扣费

9月13日

  • 新增模型o1-mini和o1-preview;
    注:最新这两个模型,要求传入参数有变,一些壳软件如果不更新默认传入的参数会报错;

需要注意

经测试,01 模型不支持以下内容,并报错:

  • system 字段:400 报错
  • tools 字段:400 报错
  • 图片输入:400 报错
  • json_object 输出:500 报错
  • structured 输出:400 报错
  • logprobs 输出:403 报错
  • stream 输出:400报错
  • o1系列:20 RPM,150,000,000 TPM,很低,随时429报错
  • 其他:temperature, top_p and n 被固定为1;presence_penalty 和 frequency_penalty 被固定为 0

9月10日

  • 新增模型:mattshumer/Reflection-Llama-3.1-70B;ps:据说llama3.1-70b最强微调版本
  • claude-3模型价格上调调整,为了维持claude模型稳定供应,目前调用我们会比直接调用官方贵10%,后续会逐步下调;
  • 增加了openai系列模型的并发能力,理论上基本支持无限并发;

8月11日

  • 新增模型:Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
  • 增加了Llama相关模型的稳定性
  • 进一步优化了claude模型的兼容性

8月7日

8月4日

7月27日

  • 新增支持Mistral Large 2,模型名称:Mistral-large-2407或者aihubmix-Mistral-large-2407;
  • 系统优化

7月24日

  • 新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant;欢迎尝试;

7月20日

  • 已修复gpt-4o-mini模型在价格计算方面的问题。具体情况如下:
    文本输入价格:OpenAI官方的gpt-4o-mini模型输入文本的价格仅为gpt-4o模型价格的1/33。
    图片输入价格:OpenAI官方的gpt-4o-mini模型输入图片的价格与gpt-4o模型价格相等。
  • 为了确保价格计算的准确性,我们在计算gpt-4o-mini模型输入图片的token数时,将其乘以33倍,以与官方价格对齐。
  • 详情可见 Open AI官方价格
    图片
    图片

7月19日

  • 新增支持gpt-4o-mini模型,后台计费同步官方

7月15日 公告

  • 支持官方的api 参数 include_usage,传入参数可返回stream模式下的usage,详情见 官方文档

7月14日 公告

  • 新版本nextweb增加了支持调用非openai模型 调用本站非OpenAI模型
  • 增加了阿里千问模型的后台扣费,总统调用我们的成本比调用阿里云官方贵10%左右
  • 优化azure openai返回的输出更好的兼容了openai 接口
  • 支持claude-3的tool Calling
  • 增加了很多新模型,见 设置 可用模型

7月3日 公告

  • 整体后台界面进行了优化
  • 日志每条请求记录增加了展示请求时当时的模型单价
  • 增加了模型及价格页面 模型/价格

6月20日 公告

6月18日 公告

  • 后台日志页面现在开始,支持下载使用请求记录

6月16日 公告

  • 降低了随机到azure openai 的概率,现在几乎很小概率会随机到

6月13日 公告

  • 下调Claude-3相关模型的费用(Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus)后台扣费和官方一致;因此当前我们网站额度零售价格,使用我的API的成本相当于官网86折;

6月10日 公告

  • 整体服务架构升级,全部服务器和数据迁入微软azure;
  • 未来我将基于one api的开源版本项目进行二次深度开发和优化(原本我们已通过赞助获得oneapi项目商业版授权)
  • 日志部分数据量太大(超过1亿级的请求日志)因此暂时无法迁移,如需查询之前的老日志请联系客服
  • 优化gpt-4o的token计费, tokenizer的cI100k_base 改为0200k_base ,之前的gpt-4 系列用的是cI100k_base;结果就是中文、韩文、日文的流式请求的token计数会比之前下降;

6月8日 公告

  • 新增阿里最新开源模型Qinwen2
  • alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct

5月20日 公告

  • 新增模型gemini-1.5-flash
  • 新增模型gpt-4o
  • 江苏地区进入充值页面报错,因为充值域名被电信劫持,请先 联系客服 进行充值。
  • 新增llama3(llama3-70b-8192、llama3-8b-8192)gemini-1.5-pro、command-r、command-r-plus、欢迎调用尝试
  • Claude-3模型恢复供应;目前本站正在连接Claude-3部署在aws和Google cloud上的端点。
  • 为了维持服务器费用及团队成本,Claude-3模型和价格后台扣费比官方贵10%
  • 后续调用量增加的话,会逐步下调至5%左右,甚至更低,
  • 目前并发有待测试和随着调用增加而去申请更高的并发调用。