突破“轮次对话”模式Soul技术升级让AI交流更具“活人感”

2025-07-21万象ai

作为聚焦年轻用户社交需求的平台，SoulApp近日正式升级自研端到端全双工语音通话大模型，通过技术突破，让AI自主决定说话时机，打破传统“轮次对话”模式，为用户带来更自然、沉浸的人机交互体验。此次升级不仅是Soul在AI社交领域的又一探索，更彰显了其以技术赋能情感连接的持续努力。

新模型摒弃了传统语音交互中依赖的VAD（话音激活检测）机制与延迟控制逻辑，打破行业中普遍存在的“轮次对话”模式，赋予AI自主决策对话节奏的能力。AI可实现主动打破沉默、适时打断用户、边听边说、时间语义感知、并行发言讨论等。同时，模型具备**度感知（包括时间感知、环境感知、事件感知等），口语化表达（如语气词、结巴、明显情绪起伏），音色复刻等能力，让AI更具“真人感”，支持打造更沉浸、类现实交互的语音互动新体验。

为了尽可能保证全双工对话模型的基础对话能力，避免模型“降智”，新模型采用了双LLMs的结构。由负责对话理解与生成的DialogueModel和处理语音生成的SpeechModel协同工作，实现跨模态信息的完整传递。通过精准建模“说话时机”与“沉默持续时间”，AI获得了自主决策对话节奏的能力，让AI的“真人感”大幅提升。

在社交陪伴场景中，Soul的AI能力展现出显著创新：不仅能通过情绪起伏、语气词等细节传递鲜明情感，还能深度整合人设与上下文，构建连贯的“数字人格”故事线。此外，除了一对一的情感倾诉，目前Soul团队还在探索多人语音中的话题引导，让AI能自然融入，成为用户社交关系网络的重要补充。

通过技术创新打破人机交互的边界，Soul正不断丰富着社交场景的可能性，让AI真正成为传递情绪价值、增强用户归属感的重要力量。此次全双工语音模型的升级，进一步推动了人机互动向“情感与信息双向交流”演进。未来，Soul还将探索多人交互场景的技术应用。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

1613

146

上一篇：微软打造AI新工具：每月辅助审查60万条PR，占比超90%