生成

LTM

LTM-2-mini是一款由Magic公司开发的AI模型,支持处理高达1亿token的上下文信息。该模型采用序列维度算法,计算效率显著优于传统模型,适用于处理大规模代码库和相关文档,生成高质量代码。其长期记忆网络架构和HashHop评估体系进一步提升了模型在处理长上下文时的性能和多步推理能力。LTM-2-mini可用于代码生成与补全、代码审查、文档自动化、任务自动化及知识库构建等多种应用场景。

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具,能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导,确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域,显著提升了3D内容生成的效率和质量。

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架,支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入,结合Gemma模型和VAE技术,实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色,具备良好的下游任务迁移能力,适用于创意设计、内容创作等多个领域。

HoloPart

HoloPart 是一种基于扩散模型的 3D 分割工具,能准确识别并补全被遮挡的语义部件,支持几何与材质编辑等任务。其两阶段方法结合局部与全局注意力机制,提升分割精度与一致性。适用于动画制作、几何优化及数据生成等领域,已在多个数据集上取得优异性能。

olly.bot

Olly.bot 是一款基于 OpenAI 技术的多合一 AI 助手,集成于 iMessage 和 SMS 平台,支持网络搜索、文档分析、图片生成等功能。它无需注册或下载,保护用户隐私,适用于多个操作系统。其核心功能包括任务管理、信息查询、文档分析及创意辅助,广泛应用于日常信息查询、学术研究、工作效率提升及创意工作等领域。

闪剪_AI剪辑_数字人

闪剪是一款AI智能视频剪辑工具,自2021年起专注于数字人领域,并在2022年推出了数字人短视频创作平台。该平台提供SAAS级企业应用的数字产品,并打造了APP和网页两种产品形态。

Notato

Notato 是一款基于 AI 的笔记应用,支持音频、视频、文档及网页内容的自动转录与结构化整理,生成摘要、闪卡和测验,适用于学习、会议、资料整理等多种场景。其具备多语言翻译、错题分析、后台录音等功能,提升信息处理与知识管理效率。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

TANGO

TANGO是一个开源框架,利用分层音频运动嵌入和扩散插值网络,生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持,适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题,并有效提升了视频内容制作效率。

豆包AI视频模型

豆包AI视频模型包括PixelDance和Seaweed两款工具,分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动,适合制作情节丰富的短片;Seaweed支持多分辨率输出,生成高质量、高逼真的视频,适用于商业领域。两者均提供多样化的风格选择和输出格式,满足不同场景需求。 ---