首页 > AI教程资讯 >Open-LLM-VTuber:一个开源的具有手势和语音交互功能的AI虚拟形象

Open-LLM-VTuber:一个开源的具有手势和语音交互功能的AI虚拟形象

2025-04-10ai02门户网

Open-LLM-VTuber是什么?

Open-LLM-VTuber是一个开源的语音交互式 ai 虚拟形象,支持实时语音对话、视觉感知以及 Live2D 动画形象,并且可以完全离线运行。它支持 Windows、macOS 和 Linux 系统,并提供了丰富的功能和高度的可定制性。

Open-LLM-VTuber.webp

Open-LLM-VTuber功能亮点

跨平台支持:支持 Windows、macOS 和 Linux 系统,适配英伟达和非英伟达 GPU,支持 CPU 运行或云 API 调用。

离线模式:完全离线运行,使用本地模型,确保隐私安全。

实时语音对话:支持免提语音交互,用户可以通过语音与虚拟主播进行自然流畅的交流。

视觉感知:能够捕捉用户的面部表情变化以及环境中的光线、色彩等动态信息。虚拟主播会根据感知数据作出动态反应,例如用户微笑时,虚拟主播也会回以笑容。

Live2D 虚拟形象: 使用 Live2D 技术,虚拟主播的表情和动作极为逼真,从细微的眨眼、挑眉到肢体摆动都栩栩如生。

长期记忆:轻松回顾过往对话,内置 Mem0、EVI 等多种记忆模块,还能通过简单接口快速接入自定义记忆系统。

高级交互功能:

支持视觉感知(摄像头、屏幕录制和截图)。

语音打断功能(无需耳机,AI 不会听到自己的声音)。

触摸反馈和 Live2D 表情支持。

宠物模式(透明背景、全局置顶、鼠标穿透)。

AI 主动说话、内心 OS 显示和聊天记录持久化。

广泛的模型支持:

大语言模型(LLM):支持 Ollama、OpenAI、Gemini、Claude 等。

语音识别(ASR):支持 sherpa-onnx、FunASR、Whisper 等。

语音合成(TTS):支持 MeloTTS、Coqui-TTS、Edge TTS 等。

高度可定制:

支持导入自定义 Live2D 模型、修改 Prompt 和音色克隆。

模块化设计,通过简单的配置文件修改来切换各种功能模块。

Agent自由实现:继承并实现 Agent 接口,接入任何架构的 Agent,如 HumeAI EVI、OpenAI Her、Mem0 等。

Open-LLM-VTuber应用场景

直播互动:可以通过自定义虚拟主播形象用于娱乐直播,吸引观众并提供互动体验。

虚拟助手:作为个人虚拟助手,提供信息查询、日程管理等功能。

聊天伴侣:用户可以根据自己的需求打造专属的虚拟伴侣,如虚拟女友、男友或宠物。

创意内容创作:用于制作个性化视频、动画等。

Open-LLM-VTuber使用方法

1. 本地部署:

克隆项目代码并安装依赖。

配置 conf.yaml 文件,选择所需的 LLM、ASR 和 TTS 模型。

使用命令行工具(如 uv)运行项目。

2. 更新与卸载:

使用 uv run update.py 进行更新。

卸载时需清理项目文件夹及可能的缓存路径。

3. 客户端使用:

提供网页版和桌面客户端,支持窗口模式和桌宠模式。

支持多语言对话和 TTS 翻译。

Open-LLM-VTuber实现技术.webp

Open-LLM-VTuber实现技术

语音识别(ASR):支持多种开源和商业 ASR 引擎。

大语言模型(LLM):支持多种主流 LLM,推理后端可灵活切换。

语音合成(TTS):支持多种 TTS 技术,提供个性化语音合成。

Live2D 集成:使用 Live2D SDK 实现虚拟形象的动态渲染。

模块化设计:支持自定义模块扩展,方便开发者集成新的功能。

项目官网:https://docs.llmvtuber.com/

GitHub仓库地址:https://github.com/Open-LLM-VTuber/Open-LLM-VTuber

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之

8496
627

同类推荐更多

八大影视台词搜索神器,剪辑师必备!

八大影视台词搜索神器,剪辑师必备!

最火的AI教程资讯

2024-12-26

八大影视台词搜索神器,剪辑师必备!_映技派,专注ai人工智能!,各位朋友们,大家晚上好,给各位老铁推荐几个不错的影视台词搜索网站,剪辑师一定不要错过哦!有些朋友在看某条或某音短视频的时候,是不是很好奇或者又非常喜欢这段视频的某些台词呢?想必大家深有体会,一些经典有意义的台词真的能带给人一些感动和感悟。现在就给大家推荐这7个非常有用的运用台词就能搜索到影视剧名称的网站,肯定会对你有所帮助的,感谢大家!1、33台词-电影台词搜索引擎(http: 33 agile

游戏预约提醒

游戏正式上线前,我们将通过免费预约短信通知您

预约成功

我们将通过免费预约短信通知您

知道了

当前人数众多,预约失败!

知道了

您已预约,请等待通知!

知道了

隐私声明

严格遵守法律法规,遵循以下隐私保护原则,为您提供更加安全、可靠的服务:

1、安全可靠:

我们竭尽全力通过合理有效的信息安全技术及管理流程,防止您的信息泄露、损毁、丢失。

2、自主选择:

我们为您提供便利的信息管理选项,以便您做出合适的选择,管理您的个人信息

3、保护通信秘密:

我们严格遵照法律法规,保护您的通信秘密,为您提供安全的通信服务。

4、合理必要:

为了向您和其他用户提供更好的服务,我们仅收集必要的信息。

5、清晰透明:

我们努力使用简明易懂的表述,向您介绍隐私政策,以便您清晰地了解我们的信息处理方式。

6、将隐私保护融入产品设计:

我们在产品和服务研发、运营的各个环节,融入隐私保护的理念。

本《隐私政策》主要向您说明:

我们收集哪些信息 我们收集信息的用途 您所享有的权利

希望您仔细阅读《隐私政策》

为了让您有更好的体验、改善我们的服务或经您同意的其他用途,在符合相关法律法规的前提下,我们可能将通过某些服务所收集的信息用于我们的其他服务。例如,将您在使用我们某项服务时的信息,用于另一项服务中向您展示个性化的内容或广告、用于用户研究分析与统计等服务。

若您使用服务,即表示您认同我们在本政策中所述内容。除另有约定外,本政策所用术语与《服务协议》中的术语具有相同的涵义。

如您有问题,请联系我们。

应用权限

此应用程序需要访问以下内容

写入外部存储

允许程序写入外部存储,如SD卡上写文件

完全的网络访问权限

允许该应用创建网络套接字和使用自定义网络协议。浏览器和其他某些应用提供了向互联网发送数据的途径,因此应用无需该权限即可向互联网发送数据

拍摄照片和视频

允许访问摄像头进行拍照或录制视频

读取手机状态和身份

允许应用访问设备的电话功能。此权限可让应用确定本机号码和设备ID、是否正处于通话状态以及拨打的号码。

查看网络状态

允许应用程序查看所有网络的状态。例如存在和连接的网络

查看WLAN状态

允许程序访问WLAN网络状态信息

控制震动

允许应用控制振动设备

拨打电话

允许一个程序初始化一个电话拨号不需通过拨号用户界面需要用户确认,应用程序执行可能需要您付费