模型

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率,而且在视觉质量和运动流畅度方面表现出色,为用户提供卓越的观看体验。

MindMac

专为 macOS 设计的本机 ChatGPT 客户端。它作为 ChatGPT 的伴侣,允许用户轻松、无缝地与 OpenAI、Azure OpenAI、Google Gemini 等 AI 模型聊天。

博查AI搜索

国内首个多模型AI搜索引擎,它基于大模型和实时搜索技术,能够理解自然语言提问,并细分检索直接生成准确的答案。

诗三百

AI写诗诗三百,人工智能在线诗歌写作平台,即在线作诗机,包含AI在线作诗机。

BriefGPT AI论文速递

BriefGPT AI是一个AI论文速递网站,它可以帮助研究人员快速发现AI领域的最新研究进展。BriefGPT AI每天持续更新顶级会议和期刊上发表的AI相关论文,并提供论文标题、简要摘要以及论文PDF下载链接。

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架,旨在将静态图像中的角色或人物动态化。它采用扩散模型,结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术,确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用,包括角色动态化、时尚视频合成及人类舞蹈生成,用户可通过GitHub或Hugging Face社区轻松体验。

Astria AI

Astria是一个利用生成AI创建定制图像的平台。Astria AI允许用户上传一组主题的图像,然后根据文本提示生成新图像。

TrikAI

TrikAI是小红书旗下AI绘画平台,输入描述即可为你生成图片,尤其是国风风格。