开源 - 智狐AI导航

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型，支持用户上传图片并输入描述生成5秒短视频，具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景，参数量达130亿，已在腾讯云上线并开源，支持本地部署与定制开发，适用于创意视频、特效制作及动画开发等多个领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 694 浏览

CodeGeeX

CodeGeeX是一款基于大模型的全能的智能编程助手。它可以实现代码的生成与补全、自动添加注释、代码翻译以及智能问答等功能，能够帮助开发者显著提高工作效率。

Ai编程建站 2025年06月05日 94 点赞 0 评论 694 浏览

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 692 浏览

tldraw

tldraw是一款开源的无限画布工具，支持多人实时协作，适用于团队设计、项目管理和教育等领域。它提供了手绘风格、智能箭头、捕捉和便签等功能，以及丰富的绘图工具如画笔、橡皮擦、线框和文本工具，用户可在无限画布上自由创作，不受空间限制。

AI项目与工具 2025年06月12日 26 点赞 0 评论 691 浏览

谛韵DiffRhythm

DiffRhythm（谛韵）是一款由西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型技术，能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示，即可快速获得高质量音乐作品。其支持多语言输入，具备歌词对齐、风格定制、非自回归生成等技术优势，广泛应用于音乐创作、影视配乐、教育及个人创作等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 691 浏览

Subtitle Edit

Subtitle Edit 是一款免费开源的多功能字幕编辑器，支持超过300种字幕格式。它具备字幕同步、创建、翻译、音频波形可视化、视频播放、AI语音识别、AI自动翻译和OCR技术等功能，适用于影视后期、多语言内容创作、教育培训及辅助听力障碍者等场景。其界面友好，操作简便。

AI项目与工具 2025年06月12日 61 点赞 0 评论 690 浏览

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型，具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入，适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架，采用多通道输入处理和高效推理算法，可通过ComfyUI或Diffusers库集成使用，适合实验性开发和个性化定制。

AI项目与工具 2025年06月11日 20 点赞 0 评论 689 浏览

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用，支持多种大语言模型在本地运行。具备多模态交互能力，可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化，运行效率高，支持离线使用，保障数据安全。内置 Qwen、Gemma、Llama 等主流模型，适用于内容创作、智能助手、语言学习及创意设计等多种场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 689 浏览

Jaaz

Jaaz是一款开源的AI设计Agent，提供本地免费的AI设计服务。它能智能生成设计提示，批量生成图像、海报和故事板，并支持Ollama、Stable Diffusion等本地图像和语言模型。用户可通过GPT-4o、Flux Kontext等技术在对话中编辑图像，进行对象移除和风格转换。Jaaz提供无限创意画布，适用于创意设计、快速原型、教育及个人创作等多种场景。

AI项目与工具 2025年06月11日 79 点赞 0 评论 689 浏览

Wav2Lip是一款开源的唇形同步工具，能够将音频文件转换为与口型同步的视频。它支持多种语言，适用于视频编辑、游戏开发和虚拟现实等多个领域。Wav2Lip具备音频驱动口型生成、面部表情同步和多语言支持等功能，采用先进的技术原理，如数据预处理、音频特征提取、口型编码器、音频到口型映射及生成对抗网络（GAN）。该工具提升了电影和视频的后期制作质量，增强了虚拟现实中的交互体验，还用于游戏开发、语言学习和

AI项目与工具 2025年06月12日 80 点赞 0 评论 688 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期