AI项目与工具

MimicMotion

MimicMotion是一款由腾讯研究团队开发的高质量人类动作视频生成框架。该框架利用置信度感知的姿态引导技术，确保视频帧的高质量和时间上的平滑过渡。通过区域损失放大和手部区域增强，显著减少了图像失真，增强了手部动作的细节表现。该框架还支持长视频生成，通过渐进式潜在融合策略，确保视频生成时的时间连贯性和细节丰富度。

AI项目与工具 2025年06月12日 62 点赞 0 评论 585 浏览

FreeAskInternet

FreeAskInternet是一款免费开源的本地AI搜索引擎，集成了先进的大型语言模型和元搜索引擎，支持本地化搜索聚合和智能答案生成。它确保用户数据的私密性和安全性，无需GPU支持即可运行，并提供自定义的大型语言模型选项。此外，FreeAskInternet具备友好的用户界面，可通过简单的部署流程快速搭建。

AI项目与工具 2025年06月12日 76 点赞 0 评论 747 浏览

Fish Speech

Fish Speech是一款开源的文本到语音（TTS）工具，支持中文、英文和日文。它通过大约15万小时的多语种数据训练，实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求（仅需4GB）、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型，如VITS2、Bert-VITS2等，适用于智能助手、自动客服、语言学习等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 823 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 910 浏览

EchoMimic是一款由阿里蚂蚁集团开发的AI数字人开源项目，通过深度学习模型结合音频和面部标志点，创造出高度逼真的动态肖像视频。该工具支持音频同步动画、面部特征融合、多模态学习和跨语言能力，适用于娱乐、教育和虚拟现实等领域。其独特的技术原理包括音频特征提取、面部标志点定位、面部动画生成和多模态学习，使用了卷积神经网络（CNN）、循环神经网络（RNN）和生成对抗网络（GAN）等深度学习模型，实现

AI项目与工具 2025年06月12日 79 点赞 0 评论 983 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 739 浏览

盘盘单词

盘盘单词是一款由百度网盘推出的AI英语学习微信小程序，它运用生成式AI技术分析用户照片，提取关键元素并生成相关英语单词和例句，帮助用户加深记忆。该程序提供了个性化学习路径、名人语音智能体和智能复习计划等功能，用户的学习资料存储在云端，不占用手机内存。盘盘单词适用于希望提高英语水平的各类用户，包括学生、职场人士、语言爱好者及备考人员。

AI项目与工具 2025年06月12日 82 点赞 0 评论 597 浏览

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer（DiT）架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频，单个片段最长可达8秒，且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频，适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

AI项目与工具 2025年06月12日 47 点赞 0 评论 1142 浏览