学习

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型,具备检索增强、上下文学习及超分辨率技术,能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值,同时支持学术研究和技术探索。

Happy Scribe

一个将音频转换为文字的自动化和人工转录字幕工具,以高准确度支持多种语言和格式。

COVE

COVE是一款以AI驱动的协作工具,提供共享工作空间和实时编辑功能,支持用户与AI共同思考和工作。它能从用户的文本、表格、图像等内容中学习,提供个性化建议和多样化思路,同时无缝集成于常用工具,适用于项目管理、研究分析、内容创作、教育学习及会议记录等多个场景。

Rabbithole

Rabbithole 是一款基于AI的互动式知识探索工具,通过自然语言对话帮助用户深入了解历史事件和主题。平台支持对话记录保存、个性化内容推荐以及多样化的历史话题库,适用于历史爱好者、学生、教师及研究人员等多种用户群体,提升学习效率与知识获取深度。

Optima

Optima是一款由清华大学研发的框架,旨在通过迭代生成、排名、选择和训练过程,优化基于大型语言模型的多智能体系统。它不仅提高了通信效率和任务完成质量,还支持大规模复杂任务处理,同时集成了强化学习与蒙特卡洛树搜索技术以生成优质训练数据。Optima适用于信息不对称问答、复杂推理任务、软件开发等多个领域,具有高扩展性和低计算成本的特点。

Dippy

Dippy 是一款基于 AI 技术的个性化伴侣平台,通过虚拟角色实现与用户的互动交流。其特色包括思维链技术,使用户能洞察 AI 回答的逻辑过程;同时支持用户自定义角色外观、情感陪伴、语言学习及任务管理等功能。Dippy 目前专注于 iOS 用户群体,致力于打造高度个性化且透明的 AI 交互体验。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

DreamGen

DreamGen是英伟达推出的机器人学习技术,基于AI视频世界模型生成合成数据,使机器人能在梦境中学习新技能。它通过微调视频世界模型、生成虚拟数据、提取虚拟动作和训练下游策略四步流程,实现机器人在新环境中的行为和环境泛化。DreamGen无需大量真实数据,仅凭文本指令即可完成复杂任务,提升学习效率和泛化能力。其支持多种机器人系统和策略架构,适用于工业生产、家庭服务、医疗护理等多个领域。

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

面灵AI

面灵AI是一款基于DeepSeek大模型的智能面试辅助工具,支持实时问题解析、个性化面试策略生成、多场景模拟面试及面试反馈报告等功能。其覆盖200+行业高频场景,提供多语言支持,适用于求职者提升面试技巧、熟悉流程并优化表现。用户可通过官网注册并选择不同套餐进行使用。