GMI Cloud 发布“ AI 应用构建成本计算器”,宣布降低海外 IT 成本超40%

内容摘要新浪科技讯 7月29日晚间消息,今日闭幕的2025世界人工智能大会(展览)上,GMI Cloud 发布自研“ AI 应用构建成本计算器”,宣布通过实时量化不同场景下的算力成本、时间损耗与供应商性价比,可为开发者提供成本规划支持。典型场景评

联系电话:400-962-3929

新浪科技讯 7月29日晚间消息,今日闭幕的2025世界人工智能大会(展览)上,GMI Cloud 发布自研“ AI 应用构建成本计算器”,宣布通过实时量化不同场景下的算力成本、时间损耗与供应商性价比,可为开发者提供成本规划支持。

典型场景评估显示,使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上,回本周期缩短至行业平均水平的 1/3。

Token作为AI文本处理的基本单位,其消耗成本直接决定商业可行性。据行业数据显示,GPT-4 Turbo处理单次多步骤Agent任务消耗可达200万Token(成本约2美元),而工程化部署周期普遍被低估60%。

据介绍,GMI Cloud “ AI 应用构建成本计算器”可基于Token数量与单价(区分输入 / 输出), 核算AI应用/AI Agent 构建总花费;结合Token吞吐量(输入 / 输出速度),计算处理总请求的耗时。同时,该工具还能实时对比OpenAI、Anthropic等15家供应商的Token单价,自动标记Inference Engine等低成本替代方案。

此外,GMI Cloud Inference Engine 的底层调用GMI Cloud 全栈能力,可直接调用英伟达 H200、B200芯片,从硬件到软件进行了端到端的优化,极致优化单位时间内的Token吞吐量,确保其具备最佳的推理性能以及最低的成本,最大限度地帮助客户提升大规模工作时的负载速度以及带宽。同时,其让企业以及用户进行快速部署,选择好模型后即刻扩展,几分钟之后就可以启动模型,并用这个模型进行 Serving。(文猛)


新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: