学习

Flame

Flame是一款开源的多模态AI模型,能够将UI设计截图转换为高质量的现代前端代码。它支持React等主流框架,具备动态交互、组件化开发和高代码质量的特点。Flame通过创新的数据合成方法提升代码多样性与准确性,适用于快速原型开发、提升开发效率及辅助学习等多种场景。其训练数据、模型和测试集均已开源,为前端开发提供了高效的工具支持。

SchoolHack.ai

School Hack 将您的学习提升到一个新的水平!我们革命性的教育 AI 应用程序旨在为您提供前所未有的知识水平,使您能够比以往更快、更轻松地实现目标。

TradingAgents

TradingAgents是由加州大学洛杉矶分校与麻省理工学院联合开发的多代理LLM金融交易框架,整合多种专业角色的AI代理,通过辩论与对话进行交易决策。该系统支持多类型市场数据分析,具备风险控制、动态调整与高可解释性,适用于量化交易、资产管理、个人投资等多个场景,显著提升交易效率与透明度。

ART

ART(Anonymous Region Transformer)是一种新型多层透明图像生成技术,支持基于全局文本提示和匿名区域布局生成多个独立透明图层(RGBA格式)。通过逐层区域裁剪机制,显著提升生成效率,速度快于传统方法12倍以上。具备高质量自编码器,支持50层以上的图像生成,减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型,具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务,适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

MisoraAI

Misora AI是一款集成了深度学习与自然语言处理技术的智能搜索引擎,具备快速搜索、精准匹配及自然语言交互等功能。它不仅能为用户提供即时的文本查询结果,还能生成创意内容如诗歌、故事等,并支持图像描述服务。Misora AI适用于多种场景,包括日常信息查询、学术研究、工作辅助以及娱乐资讯获取,为用户提供了便捷高效的智能化解决方案。

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库,提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台,通过低代码开发模式简化了模型的部署和定制,广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

Scenethesis

Scenethesis是NVIDIA推出的AI框架,可通过文本生成高质量的3D场景。它结合LLM与视觉技术,经过布局规划、视觉细化、物理优化和场景验证四个阶段,确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建,广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

ZeroSearch

ZeroSearch 是阿里巴巴通义实验室开发的基于大模型的搜索引擎框架,通过强化学习技术提升搜索能力,无需依赖真实搜索引擎。它能动态生成相关或噪声文档,显著降低训练成本(超80%),并支持多种模型和算法,适用于问答、内容创作、教育等多个场景。