生成 - 智狐AI导航

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示，生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题，并采用部分参数训练和多任务训练策略，保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

AI项目与工具 2025年06月11日 11 点赞 0 评论 419 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 420 浏览

ReCapture

ReCapture是一种先进的视频处理技术，由谷歌与新加坡国立大学联合研发。它通过多视图扩散模型和点云渲染生成新视角视频，同时使用掩码视频微调技术优化视频质量，保留场景运动并补全不可见部分，广泛应用于电影制作、视频编辑、虚拟现实及新闻报道等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 420 浏览

微微在线二维码生成器

微微二维码是专业二维码制作服务商，提供视频音频二维码生成、图片文件二维码制作、二维码表单登记系统、二维码管理系统，广泛应用于：产品宣传、企业展示、旅游、教育培训、建筑...

Ai绘画生成 1970年01月01日 0 点赞 0 评论 420 浏览

Chromox AI

一个由AlkaidVision开发的文生视频、图生视频的AI工具，专注于将创意转化为视觉故事，适用于各种动态内容生成。

Ai视频生成 2025年06月05日 74 点赞 0 评论 420 浏览

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI项目与工具 2025年06月12日 80 点赞 0 评论 420 浏览

Auto Think

Auto Think是快手Kwaipilot团队开源的KwaiCoder-AutoThink-preview自动思考大模型，针对深度思考大模型的“过度思考”问题，提出了一种全新的训练范式。模型融合“思考”和“非思考”能力，能根据问题难度自动切换模式，提升复杂任务表现。在代码和数学类任务中，性能提升可达20分。其技术原理包括最小提示干预和多阶段强化学习，适用于视频生成、文案创作、智能客服等多个场景。

AI项目与工具 2025年06月11日 26 点赞 0 评论 420 浏览

救救图片

该AI图片处理工具提供去水印、抠图、去马赛克、无损放大、图片修复及生成相似图等功能，基于先进算法实现高效精准的图像编辑。支持多种格式下载，操作简便，适用于设计师、电商卖家及内容创作者，广泛应用于素材优化、商品展示和内容制作等领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 421 浏览

Modeli.ai

一个旨在使用AI模型为时尚产品优化和替代传统的拍照流程的AI模特生成工具。

电商运营 2025年06月05日 57 点赞 0 评论 421 浏览

职达AI简历

职达AI简历是一款智能简历优化平台，通过AI技术为用户提供简历生成、优化和诊断服务。用户输入基本信息后，平台可在短时间内生成专业个性化简历，并分析内容问题提供优化建议。结合岗位推荐系统，精准推送匹配岗位，提高求职效率。内置2800+模板，覆盖多种岗位，支持多端同步与个性化定制，还提供面试辅导等增值服务。

AI项目与工具 2025年06月11日 79 点赞 0 评论 421 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期