场景

象寄AI

专注商业视觉内容的智能生成,一键生成高质量商品图, 为商家提供全新的图像生产方式

鸭鸭配音

一个在线配音网站,是目前为数不多的免费的在线文字转语音的配音神器,用户只需输入文本,即可生成高度拟人的智能配音。

千面AI模特

电商模特图生成工具,拥有全网最顶尖真实度和表现力的模特生成效果

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

GRUtopia 2.0

GRUtopia 2.0是上海人工智能实验室推出的通用具身智能仿真平台,提供模块化框架、场景自动生成与高效数据采集功能。用户可使用“三行代码”快速定义任务,平台内置百万级标准化物体资产,支持复杂场景的一键生成。同时具备大规模3D场景数据集、AI驱动的NPC系统及基准测试平台,适用于机器人训练、社交互动、导航与操作等任务,推动具身智能从仿真走向现实。

Caveduck

一个AI角色扮演聊天服务,支持中、英、日韩等多语言,提供多种LLM选择,RWD支援良好,任何设备开启网页即用,无需App。

LivePPT

LivePPT是一款依托AI技术的高效PPT制作工具,能够快速生成包含专业排版与配色的演示文稿。支持用户通过输入关键词或粘贴文本的方式创建内容,并提供丰富的自定义选项,如模板风格调整、页数设定及后续美化处理。该工具广泛应用于职场、教育及生活领域,极大提升了文档制作效率。

LetMeEnglish

专注于帮助用户提升英文水平,LetMeEnglish提供免费的英文学习内容与练习资源,网站提供英文语法、英文词汇、英文句型、日常英文四大板块。

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

通义千问AI大模型

通义千问大模型AI开放平台,覆盖语言、听觉、多模态等领域;致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”