AI工具

EasyControl

EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。

DreamGen

DreamGen是英伟达推出的机器人学习技术,基于AI视频世界模型生成合成数据,使机器人能在梦境中学习新技能。它通过微调视频世界模型、生成虚拟数据、提取虚拟动作和训练下游策略四步流程,实现机器人在新环境中的行为和环境泛化。DreamGen无需大量真实数据,仅凭文本指令即可完成复杂任务,提升学习效率和泛化能力。其支持多种机器人系统和策略架构,适用于工业生产、家庭服务、医疗护理等多个领域。

LocAgent

LocAgent是一款由多所高校联合开发的代码定位工具,通过构建代码库的图结构并结合大语言模型进行多跳推理,帮助开发者快速找到需修改的代码片段。支持多种开发任务,如错误修复、功能添加和性能优化,具备高效的搜索与定位能力,适用于大规模代码维护场景。

DeepGEMM

DeepGEMM是DeepSeek开发的高效FP8矩阵乘法库,专为NVIDIA Hopper架构优化,支持普通与分组GEMM操作。采用即时编译技术,实现运行时动态优化,提升计算性能与精度。通过细粒度缩放和双级累加技术解决FP8精度问题,结合TMA特性提升数据传输效率。代码简洁,仅约300行,适用于大规模AI推理、MoE模型优化及高性能计算场景。

Cofounder

Cofounder是一款基于生成式AI技术的开源全栈开发工具,可依据单一提示生成完整的Web应用程序,涵盖后端、前端、数据库及API。其特色包括AI辅助原型设计、模块化设计系统和生成式UI,旨在简化开发流程并提升效率。适用于快速原型开发、敏捷开发、教育领域及企业数字化转型等多种场景。

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型,专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题,并支持以即插即用的形式融入现有扩散模型,无需重新训练即可实现高效的空间控制。

restorePhotos.io

restorePhotos.io 是一款基于GFPGAN模型的AI工具,专注于修复老旧和模糊的人脸照片。它具备用户友好的界面设计,支持批量处理及隐私保护功能,能够显著提升照片质量和清晰度。凭借其强大的技术支撑,restorePhotos.io 可应用于个人家庭、文化遗产保护、档案管理等多个领域,为用户提供高质量的照片修复服务。

Mindshow

MindShow是一款智能的在线PPT生成工具,通过强大的AI人工智能技术,根据用户输入的大纲文字自动为其生成漂亮的PPT页面。它旨在帮助用户节省设计和排版的时间和精力,让用户专注于内容创作。

Company Research Agent

Company Research Agent是一款基于多智能体框架的公司研究工具,支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能,确保信息的相关性和准确性,并通过WebSocket实现实时进度更新,提升研究效率和用户体验