AI项目与工具

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型,支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能,适用于自动化任务执行和复杂交互场景。支持云端与本地部署,提供丰富的开发接口,便于集成与扩展。

OpenELM

OpenELM是苹果公司推出的一系列高效开源语言模型,涵盖从2.7亿到30亿参数规模的不同版本。该模型基于Transformer架构,采用层间缩放策略优化参数分配,使用分组查询注意力(GQA)和SwiGLU激活函数等技术。OpenELM在公共数据集上预训练,并在多项自然语言处理任务中展现出色性能。模型代码和预训练权重已公开,旨在促进开放研究和社区发展。

Intellectia

Intellectia是一款基于AI技术的智能投研平台,专注于金融领域的数据分析与决策支持。其核心功能包括股票和加密货币的技术分析、市场数据汇总、新闻情绪分析等,并通过多种指标和工具简化投资流程,满足个人投资者、企业分析师及资产管理者的多样化需求。产品设计注重易用性与高效性,旨在帮助用户做出更明智的投资决策。

Poetry2Image

Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架,专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制,提升了诗歌与图像的一致性,解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能,与多种图像生成模型结合使用时,其元素完整性和语义一致性表现优异,适用于古诗词

OmniSVG

OmniSVG是复旦大学与StepFun联合开发的全球首个端到端多模态SVG生成模型,基于预训练视觉语言模型,通过创新的SVG标记化技术实现结构与细节的解耦,支持从文本、图像或角色参考生成高质量矢量图形。其训练效率高,支持长序列处理,适用于图标设计、网页开发、游戏角色生成等场景,生成结果具备高度可编辑性和跨平台兼容性。

HUGWBC

HUGWBC是由上海交通大学与上海AI Lab联合开发的人形机器人全身控制器,支持多种自然步态和精细参数调整,具备高鲁棒性和实时外部干预能力。基于强化学习和不对称训练框架,实现从模拟到现实的高效迁移,适用于复杂地形导航、动态任务执行及人机协作等多种场景。

智谱AI开放平台

智谱AI开放平台是一个面向开发者的大模型开发平台,集成了多种先进模型和技术资源。该平台支持统一API接入,涵盖AI视频生成、文生图、多模态视觉、长文本等多种大模型。平台还提供定制化知识解决方案和互动体验,支持云上私有化部署。适用于软件开发者、数据科学家、AI研究者、企业决策者和创业者等人群。

OceanDoc

OceanDoc是科大讯飞推出的AI智能办公工具,基于大语言模型和自然语言处理技术,可自动将文本转化为高质量PPT幻灯片,并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景,简化演示文稿制作流程,提升效率与专业性。

麦当秀MindShow

MindShow是一款在线AI PPT生成和演示工具,它能够帮助用户快速创建高质量的演示文档。通过结合定制算法和智能设计能力,用户可以将想法和内容高效地转化为专业的PPT演示文稿。MindShow支持从多种格式的文档导入内容,并提供智能文档翻译功能,用户可以轻松生成多语言演示文档。其主要功能包括一键智能生成PPT、自动设计图片、多格式导入支持、智能文档翻译、丰富的模板和主题以及在线协作编辑。

Markdown

Markdown-to-Image 是一个基于 React 的开源工具,可将 Markdown 文本转换为图像,支持多种输出格式和自定义样式。其应用场景包括社交媒体内容创作、技术文档可视化、博客标题设计以及教育和营销材料制作,具备强大的灵活性和易用性。