ChatAnyone ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。 AI项目与工具 2025年06月12日 72 点赞 0 评论 243 浏览
Pika Twists Pika Twists 是 Pika Labs 推出的 AI 视频编辑工具,支持用户精准操控视频中的主体动作和场景,实现创意效果。通过简单描述即可完成角色或物体的动作修改,同时保持画面自然。功能包括主体操控、元素调整、风格化处理、逼真渲染等,适用于短视频、广告、教学等多种场景,提高视频创作效率和表现力。 AI项目与工具 2025年06月11日 85 点赞 0 评论 337 浏览
Omni Reference Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能,允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数,用户可灵活控制参考图像的权重与风格融合程度,提升创作精度与多样性。支持 Web 和 Discord 两种平台操作,适用于角色嵌入、产品展示、场景构建等多种应用场景。 AI项目与工具 2025年06月11日 48 点赞 0 评论 352 浏览
OmniConsistency OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略,将风格学习与一致性学习解耦,并支持与任意风格的 LoRA 模块集成,实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性,具备更高的灵活性和泛化能力,在实验中表现出与 GPT-4o 相当的性能。 AI项目与工具 2025年06月11日 40 点赞 0 评论 400 浏览
Genspark AI幻灯片 一款能够快速将如PDF、Excel、Word等数据格式转化为专业PPT幻灯片的工具,支持一句话交互修改、艺术风格化设计,并可导出为PPTX、PDF等格式 PPT资源 2025年06月05日 71 点赞 0 评论 437 浏览
MagicEdit MagicEdit 是字节跳动的一款视频编辑工具,它可以高保真度和时间连贯性地编辑视频,通过学习明确区分外观和动作。 Ai开源项目 2025年06月05日 40 点赞 0 评论 257 浏览
Lumiere 谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。 Ai开源项目 2025年06月05日 74 点赞 0 评论 372 浏览
Omni Translator 一款功能强大的多合一在线翻译工具,允许用户自定义翻译器以将自然语言或其他语言转换为任何翻译风格或类型的语言,如正式、幽默、简洁或诗意等。 Ai办公效率 2025年06月05日 37 点赞 0 评论 406 浏览
Photo AI Photo AI 是一种革命性的人工智能工具,使用ai为您提供专业水准的照片拍摄,用于在各种设置中生成逼真的图像。 Ai图片处理 2025年06月05日 38 点赞 0 评论 214 浏览
抖音星绘 一款由抖音推出的AI相机类产品,支持AI分身、AI修图和文生图功能。用户可以通过上传图片并输入提示词来轻松切换照片风格,如像素风、赛博朋克、日式漫画等。 Ai图片处理 2025年06月05日 42 点赞 0 评论 483 浏览