Skip to main content

更新日志

11月07日

兼容claude 原生sdk，v1/messages接口已支持上线；
claude原生接口的缓存和控制计算机功能还不支持（prompt caching和computer use）我们会在接下来的两周内继续完善。

11月05日

新增模型：claude-3-5-haiku-20241022
新增马斯克x.ai最新模型grok-beta

10月23日

新增模型：claude-3-5-sonnet-20241022

10月10日

OpenAI最新的缓存功能现已上线。此功能目前支持以下模型：

GPT-4o
GPT-4o-mini
o1-preview
o1-mini

请注意，gpt-4o-2024-05-13版本不在官方支持范围内。

如果请求命中缓存，您将能够在后台日志中看到相关的缓存token数据。

更多详细信息和使用规则，请访问OpenAI官方网站：OpenAI缓存功能详情

10月03日

gpt-4o模型后台计费下降价格同步官方
新增模型：aihubmix-Llama-3-2-90B-Vision，aihubmix-Llama-3-70B-Instruct
新增cohere最新模型aihubmix-command-r-08-2024，aihubmix-command-r-plus-08-2024

9月19日

新增模型：whisper-large-v3和distil-whisper-large-v3-en
注意：whisper模型实际计费是按照输入的秒数计费的，但是目前页面价格展示有问题未来会修复，后台底层计费没有问题whisper-1 完全同步openai官方扣费

9月13日

新增模型o1-mini和o1-preview；
注：最新这两个模型，要求传入参数有变，一些壳软件如果不更新默认传入的参数会报错;

需要注意

经测试，01 模型不支持以下内容，并报错：

system 字段：400 报错
tools 字段：400 报错
图片输入：400 报错
json_object 输出：500 报错
structured 输出：400 报错
logprobs 输出：403 报错
stream 输出：400报错
o1系列：20 RPM，150,000,000 TPM，很低，随时429报错
其他：temperature, top_p and n 被固定为1；presence_penalty 和 frequency_penalty 被固定为 0

9月10日

新增模型：mattshumer/Reflection-Llama-3.1-70B；ps：据说llama3.1-70b最强微调版本
claude-3模型价格上调调整，为了维持claude模型稳定供应，目前调用我们会比直接调用官方贵10%，后续会逐步下调；
增加了openai系列模型的并发能力，理论上基本支持无限并发；

8月11日

新增模型：Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k
增加了Llama相关模型的稳定性
进一步优化了claude模型的兼容性

8月7日

新增openai刚刚更新4o版本gpt-4o-2024-08-06，见https://platform.openai.com/docs/guides/structured-outputs
新增google最新模型：gemini-1.5-pro-exp-0801

8月4日

增加了在线直接支付充值
修复了claude多轮对话格式报错问题：1、messages: roles must alternate between "user" and "assistant", but found multiple "user" roles in a row；
优化了claude模型的使用function功能时index问题
https://orisound.cn备用服务器将在9月7日全面下线；目前在使用这个地址的请抽空改成主服务器https://aihubmix.com或者备用服务器https://api.aihubmix.com

7月27日

新增支持Mistral Large 2，模型名称：Mistral-large-2407或者aihubmix-Mistral-large-2407；
系统优化

7月24日

新增最新llama-3.1模型llama-3.1-405b-instruct,llama-3.1-70b-versatile和llama-3.1-8b-instant；欢迎尝试；

7月20日

已修复gpt-4o-mini模型在价格计算方面的问题。具体情况如下：
文本输入价格：OpenAI官方的gpt-4o-mini模型输入文本的价格仅为gpt-4o模型价格的1/33。
图片输入价格：OpenAI官方的gpt-4o-mini模型输入图片的价格与gpt-4o模型价格相等。
为了确保价格计算的准确性，我们在计算gpt-4o-mini模型输入图片的token数时，将其乘以33倍，以与官方价格对齐。
详情可见 Open AI官方价格

7月19日

新增支持gpt-4o-mini模型，后台计费同步官方

7月15日公告

支持官方的api 参数 include_usage，传入参数可返回stream模式下的usage，详情见 官方文档

7月14日公告

新版本nextweb增加了支持调用非openai模型 调用本站非OpenAI模型
增加了阿里千问模型的后台扣费，总统调用我们的成本比调用阿里云官方贵10%左右
优化azure openai返回的输出更好的兼容了openai 接口
支持claude-3的tool Calling
增加了很多新模型，见设置可用模型

7月3日公告

整体后台界面进行了优化
日志每条请求记录增加了展示请求时当时的模型单价
增加了模型及价格页面 模型/价格

6月20日公告

最新claude-3-5-sonnet-20240620已支持，调用方法见 调用本站非open AI模型教程

6月18日公告

后台日志页面现在开始，支持下载使用请求记录

6月16日公告

降低了随机到azure openai 的概率，现在几乎很小概率会随机到

6月13日公告

下调Claude-3相关模型的费用（Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus）后台扣费和官方一致；因此当前我们网站额度零售价格，使用我的API的成本相当于官网86折；

6月10日公告

整体服务架构升级，全部服务器和数据迁入微软azure；
未来我将基于one api的开源版本项目进行二次深度开发和优化（原本我们已通过赞助获得oneapi项目商业版授权）
日志部分数据量太大（超过1亿级的请求日志）因此暂时无法迁移，如需查询之前的老日志请联系客服
优化gpt-4o的token计费， tokenizer的cI100k_base 改为0200k_base ，之前的gpt-4 系列用的是cI100k_base；结果就是中文、韩文、日文的流式请求的token计数会比之前下降；

6月8日公告

新增阿里最新开源模型Qinwen2
alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct

5月20日公告

新增模型gemini-1.5-flash
新增模型gpt-4o
江苏地区进入充值页面报错，因为充值域名被电信劫持，请先 联系客服 进行充值。
新增llama3（llama3-70b-8192、llama3-8b-8192）gemini-1.5-pro、command-r、command-r-plus、欢迎调用尝试
Claude-3模型恢复供应；目前本站正在连接Claude-3部署在aws和Google cloud上的端点。
为了维持服务器费用及团队成本，Claude-3模型和价格后台扣费比官方贵10%
后续调用量增加的话，会逐步下调至5%左右，甚至更低，
目前并发有待测试和随着调用增加而去申请更高的并发调用。