2025-08-0702ai门户网
8月6日消息,OpenAI当地时间昨日以Apache2.0许可证的形式推出了两款gpt-oss系列开放推理模型,其中参数规模较小的gpt-oss-20b模型可在仅配备16GB内存的边缘设备上运行、参数更多的gpt-oss-120b则能在单个80GBGPU上高效运行。
AMD与高通均宣布旗下硬件支持gpt-oss系列开放模型,具体是AMD锐龙AIMax+395处理器支持gpt-oss-120b、AMDRadeonRX907016GB显卡支持gpt-oss-20b、高通旗舰骁龙平台支持gpt-oss-20b。
AMD宣称锐龙AIMax+395是全球首款能运行gpt-oss-120b模型的消费级AIPC处理器:采用GGML框架转换的MXFP4格式gpt-oss-120b大约需要61GB显存,而"StrixHalo"平台在128GB统一内存下支持将96GB分配给GPU,轻松满足这一需求。
锐龙AIMax+395在gpt-oss-120b上有30Token/s的输出速率,同时支持该模型的MCP模型上下文协议实现。
而RadeonRX907016GB显卡则能在gpt-oss-20b上实现出色的首Token输出时间(TTFT)和每秒Token输出数量表现。
高通表示根据早期测试gpt-oss-20b可在端侧实现出色思维链推理表现,开发者可通过HuggingFace和Ollama等热门平台在搭载骁龙芯片的设备上访问gpt-oss-20b模型并充分发挥其功能。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之
新品榜/热门榜