应用

CogAgent

CogAgent是一款由清华大学与智谱AI联合开发的多模态视觉大模型,专注于图形用户界面(GUI)的理解与导航。它具备视觉问答、视觉定位、GUI Agent、高分辨率图像处理及多模态能力,可应用于自动化测试、智能交互、多模态人工智能应用开发、企业级AI Agent平台等多个领域。CogAgent在多个基准测试中表现出色,尤其在GUI操作数据集上显著超越现有模型。

七麦数据

七麦数据是一个专注于移动应用数据分析商业分析平台、提供ASO优化服务的平台,涵盖了iOS、安卓等应用市场数据,致力于帮助开发者进行应用市场的优化,借鉴用于自己产品进行迭代优化。

text.cortex

text.cortex是一款集成了文本重写、句子扩展、长篇内容生成、文本摘要、多语言翻译及语法检查等功能的AI写作辅助工具。其核心优势在于支持超过25种语言,用户可通过高亮文本直接使用工具栏优化内容。无论是学术研究、商业报告还是日常写作,text.cortex都能显著提高创作效率与质量。

FantasyTalking

FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具,能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略,结合面部专注的交叉注意力模块和运动强度调制模块,实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态,适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

ZelinAI

ZelinAI是一个AI应用构建平台,允许用户通过零代码方式构建自己的AI应用。它专注于Prompt学习和训练、AI参数调试等场景,并支持将模型打包为专属AI应用。此外,用户还可以通过分享...

响指HaiSnap

HaiSnap是一款零代码AI应用开发平台,支持可视化操作和多模型调用,涵盖文本生成、图像识别等功能。用户可快速搭建并部署应用至云端,同时享受任务管理、小工具和小游戏等辅助功能,适用于教育、企业及个人场景,提升开发效率与用户体验。

Profluent.bio

领导蛋白质设计,用AI 解码蛋白质的语言。设计新颖、最佳的蛋白质,绕过行业中现有的障碍。

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架,能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动,创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频,具有低延迟的特点,并且能够处理多种类型的输入,如艺术照片、歌唱音频和非英语语音。此外,通过灵活的生成控制,用户可以调整输出的多样性和适应性。

扣子空间

扣子空间是由字节跳动推出的AI Agent平台,支持用户通过可视化界面快速构建和管理AI应用,无需编程基础。平台集成60余款MCP插件,涵盖资讯、出行、办公等功能,提供探索与规划两种协作模式,适应不同任务需求。用户可将开发的Bot发布至微信、飞书等平台,也可自定义插件扩展功能。适用于商品推荐、播客制作、智能协作等多种场景,具备良好的扩展性与实用性。

LLaDA

LLaDA是一款基于扩散模型框架的新型大型语言模型,由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布,采用Transformer作为掩蔽预测器,优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出,尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异,适用于多轮对话、文本生成、代码生成、数学推理和语