模型

Fashion

Fashion-VDM是一款由谷歌和华盛顿大学合作研发的虚拟试穿技术,利用视频扩散模型生成人物穿着指定服装的高质量试穿视频,具有高保真度、时间一致性及强大的服装细节还原能力。它结合了扩散模型架构、分割分类器自由引导与渐进式时间训练策略,并在图像与视频数据联合训练的基础上实现了高效稳定的视频生成过程。

AIFlowy

AIFlowy 是一款基于 Java 的开源 AI 应用开发平台,支持智能对话机器人、私有知识库构建、AI 工作流编排及大模型管理等功能。平台提供完善的系统管理模块,适用于企业级应用开发与部署,助力提升业务流程智能化水平。

DynVFX

DynVFX是一种基于文本指令的视频增强技术,能够将动态内容自然地融入真实视频中。它结合了文本到视频扩散模型与视觉语言模型,通过锚点扩展注意力机制和迭代细化方法,实现新内容与原始视频的像素级对齐和融合。无需复杂输入或模型微调,即可完成高质量的视频编辑,适用于影视特效、内容创作及教育等多个领域。

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具,具备文本到视频生成、图像到视频转换等功能,支持高清视频输出及音效匹配。它通过三维变分自编码器(3D VAE)、Transformer架构等技术手段,提升了视频生成的质量与效率,适用于内容创作、广告营销、教育培训等多个领域。

探迹SalesGPT

探迹SalesGPT通过其大数据和AI技术,为企业提供全方位的智能销售解决方案,帮助企业实现销售流程的数字化转型,提升销售效率和业绩。

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具,基于StyleTTS 2与ISTFTNet架构,支持多种语音风格和自然语调,具备实时处理能力。支持美式与英式英语,提供10种语音包,适用于教育、游戏、客服等多种场景。支持本地部署与API集成,确保数据安全与高效运行。

Qwen2.5

Qwen2.5-Coder是一款开源代码生成模型,覆盖多种规模参数,支持超过40种编程语言,擅长代码生成、推理、修复及多语言支持。其旗舰模型在多项基准测试中表现优异,具备强大的长上下文处理能力和人类偏好对齐特性。适用于日常编程、代码学习、教育、代码审查及自动化测试等场景。

文远知行

全球领先的自动驾驶科技公司,文远知行提供从L2到L4的自动驾驶产品和服务,涵盖Robotaxi、Robobus、Robovan等多种自动驾驶车辆。

像塑

抖音AR特效开放平台,通过像塑抖音,您可以组合不同的素材与能力来构建可应用于人脸、身体或场景的炫酷趣味AR视效。

DeepClaude

DeepClaude 是一款高性能开源 AI 工具,融合 DeepSeek R1 和 Claude 模型,具备推理、创造力和代码生成能力。它提供零延迟响应、端到端加密和本地 API 管理,保障数据安全。支持高度自定义,适用于智能客服、代码生成、推理分析及教育等多场景,满足多样化需求。