新闻中心

相比较 2022 年 12 月发布的 text-embedding-ada-002 模型

2024.02.02 | admin | 25次围观

　　IT之家 1 月 27 日消息，OpenAI 近日发布新闻稿，在更新 GPT-4 Turbo 预览模型之外，还下调 API 调用价格，优化现有模型性能，并发布全新嵌入性模型。

　　OpenAI 今天一口气宣布了 5 个新模型，包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。

　　更新 GPT-4 Turbo 预览模型

　　OpenAI 根据开发者对早期预览版的反馈，发布了 gpt-4-0125-preview 预览模型，重点修复了模型的“变懒”情况，能更彻底地完成代码生成等任务。

　　新预览版还改善了对非英语生成问题的支持，引入“gpt-4-turbo-preview”模型别名，可自动指向最新的预览版。

　　OpenAI 还计划在未来几个月内全面推出带有视觉功能的 GPT-4 Turbo。

　　定价更低的新嵌入模型

　　OpenAI 还引入了两种新的嵌入模式，一种是体积更小、效率更高的 text-embedding-3-small 模型，另一种是体积更大、功能更强的 text-embedding-3-large 模型。

　　嵌入（embedding）是表示自然语言或代码等内容中概念的数字序列。机器学习模型和其他算法通过嵌入，可以更容易理解内容之间的关联，也更容易执行聚类或检索等任务。

　　ChatGPT 和 Assistants API 中的知识检索等应用，以及许多检索增强生成（RAG）开发工具都使用到了嵌入这个概念。

　　text-embedding-3-small

　　相比较 2022 年 12 月发布的 text-embedding-ada-002 模型，text-embedding-3-small 性能和效率大幅提升。

　　性能方面，text-embedding-3-small 在多语言检索常用基准（MIRACL）的平均得分从 31.4% 提高到 44.0%，而英语任务常用基准（MTEB）的平均得分从 61.0% 提高到 62.3%。

　　定价方面，text-embedding-3-small 的定价是 text-embedding-ada-002 的五分之一，从每 1k token 0.0001 美元降至 0.00002 美元。

　　text-embedding-3-large

　　text-embedding-3-large 是 OpenAI 新推出的性能最佳的模型。将 text-embedding-ada-002 与 text-embedding-3-large 进行比较：在 MIRACL 上，平均得分从 31.4% 提高到 54.9%，而在 MTEB 上，平均得分从 61.0% 提高到 64.6%。

　　text-embedding-3-large 的价格为每 1k token 售价 0.00013 美元。

　　原生支持 shortening

　　允许开发人员以降低存储和计算需求来换取一定的准确性。简单地说，保持主旨不变的情况下，shortening 就像从一个复杂的标签中去掉一些不那么重要的细节。

　　GPT-3.5 Turbo

　　在 API 领域，GPT-3.5 Turbo 同样表现不俗。在执行各类任务时，它不仅能够提供比 GPT-4 更低的成本，还能保证更快的执行速度。

　　因此，对于那些付费用户来说，此次输入价格下调 50%、输出价格下调 25% 无疑是一大利好。

　　具体来说，新的输入价格定格在每 1k token 价格为 0.0005 美元，而输出价格则为每 1k token 价格为 0.0015 美元。

相比较 2022 年 12 月发布的 text-embedding-ada-002 模型

版权声明

本文仅代表作者观点，不代表xx立场。
本文系作者授权xxx发表，未经许可，不得转载。

相比较 2022 年 12 月发布的 text-embedding-ada-002 模型

版权声明

发表评论

作者其它文章

体育运动项目经营包括什么

体育赛事承办公司品牌vi设计

欧洲杯2021赛程时间表比利时对丹麦,欧洲杯比分丹麦比利时

热门文章

随机文章

最近发表

标签列表

相比较 2022 年 12 月发布的 text-embedding-ada-002 模型

版权声明

相关阅读

发表评论

作者其它文章

体育运动项目经营包括什么

体育赛事承办公司品牌vi设计

欧洲杯2021赛程时间表比利时对丹麦,欧洲杯比分丹麦比利时

热门文章

随机文章

最近发表

标签列表