AI

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需中间3D或2D表示,可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法,提升视频时间一致性,并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。

Musick Ai

一款AI音乐生成器,Musick Ai可以创作跨流派的高品质、情感丰富的音乐,提供具有不同音乐风格的个性化、专业级作品。

100+ AI Prompts

一个有组织的关于ChatGPT, Dall-e, Midjourney和Stable Diffusion的提示板,任何人都可以使用或从他们自己的提示中获得灵感。

方便面AI面试

AI面试工具是企业智能化招聘的解决方案,支持全球候选人通过微信小程序或浏览器参与结构化初筛面试。具备智能画像、语义分析、表情识别等功能,从能力适配度、文化匹配度和领导力潜质三方面评估候选人。支持多岗位、多语言、多时区接入,与主流招聘系统无缝对接,提升招聘效率与精准度,适用于全球化、校园、远程及中高端人才招聘场景。

浪潮海若大模型

浪潮海若大模型是一个多功能、高效率的行业解决方案,它通过整合先进的大数据和人工智能技术,为不同行业提供定制化的服务。

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

Inverse Painting

Inverse Painting 是一种基于 AI 的创新技术,能够逆向还原绘画过程,通过分析艺术家的绘画视频学习技巧与顺序,生成详细的绘画指令,逐步更新画布,模拟创作流程。该工具可应用于艺术教育、艺术创作辅助、文化遗产保护、艺术品鉴定、娱乐产业及交互式媒体等多个领域。

Aishort

AIShort 提供一份简便的 ChatGPT 指令列表,可迅速筛选和查询适应各种场景的提示词,从而帮助用户精简操作过程,并提供了浏览器插件方便直接调用。