人工智能

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

Make-A-Character

创新的3D角色生成框架,它通过文本描述快速创建逼真的3D角色,具有高度的定制性和逼真度。它结合了最新的人工智能技术,提供了一个直观、灵活且高效的角色创建解决方案,适用于多...

Rask Ai

Rask AI是新一代的视频翻译和配音工具,是一个利用先进的人工智能技术来自动化视频内容本地化和翻译过程的平台。

红薯通AI

红薯通AI是一款专为小红书用户设计的人工智能写作助手,提供高效的内容创作支持。它具备基于人工智能技术的创作辅助、改写助手、个性化创作建议、智能素材推荐和跨平台兼容性等功能,旨在提升用户的内容创作质量和效率。红薯通AI适用于自媒体运营、商家引流、产品销售、代运营服务、内容创作者、品牌营销、旅游和美食分享及生活分享等多种应用场景。

OptoChat AI

OptoChat AI是国内首款面向光子领域的AI大模型,整合超30万条光子芯片相关数据资源,具备强大的数据分析与智能算法能力。可实现光子芯片设计优化、工艺验证、文献检索等功能,显著提升研发效率,缩短设计周期。适用于科研、制造、教育及市场分析等多个场景,推动光子产业智能化发展。

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。

SongR AI

一款可以让用户只需几个关键词创建定制歌曲的平台。无论用户的音乐经验如何,SongR AI都可以让你生成个性化的歌曲。

FaceCheck.ID

FaceCheck.ID是一款利用人工智能和面部识别技术的平台,帮助用户在互联网和社交媒体中定位和验证个人身份。它能够搜索社交媒体、新闻、博客及犯罪数据库,提供精确的面部匹配结果,同时具有高级过滤器和隐私保护功能,适用于身份核实、诈骗防范及犯罪嫌疑人追踪等多种场景。

Optima

Optima是一款由清华大学研发的框架,旨在通过迭代生成、排名、选择和训练过程,优化基于大型语言模型的多智能体系统。它不仅提高了通信效率和任务完成质量,还支持大规模复杂任务处理,同时集成了强化学习与蒙特卡洛树搜索技术以生成优质训练数据。Optima适用于信息不对称问答、复杂推理任务、软件开发等多个领域,具有高扩展性和低计算成本的特点。

Bing Video Creator

Bing Video Creator是微软推出的AI视频生成工具,基于OpenAI的Sora模型,用户可通过输入文本描述快速生成5秒短视频。支持9:16格式,提供快速模式和标准模式,初始有10次免费生成机会。功能包括视频生成、多种风格选择、视频存储和分享等,适用于广告、教学、创意和个人娱乐等多种场景。