AI项目与工具

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型,基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入,可生成结构化文本输出,并具备音频转录、情感分析等功能。可在本地设备运行,响应时间低至 50 毫秒,适用于语音助手、内容生成和学术任务定制。

WriteHERE

WriteHERE是一款基于异质递归规划技术的开源AI写作框架,支持生成超长文本并动态分解写作任务为检索、推理和写作三种异构模块。通过有向无环图管理任务依赖关系,实现自适应执行,适用于小说创作、技术报告、行业分析等多场景。其数学形式化设计与任务可视化功能提升了写作过程的可控性和一致性,具备良好的扩展性与灵活性。

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台,提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入,具备微信扩展、插件系统和支付接口,适用于企业及个人开发者构建智能应用。

Particle News

Particle News是一款以AI驱动的新闻阅读平台,通过聚合多源信息,为用户提供个性化、简洁的新闻摘要与多视角报道。其核心功能包括个性化订阅、多样化新闻风格展示、互动问答及音频新闻服务,旨在帮助用户高效获取全面、客观的信息。适用于通勤、学习、工作等多种场景,适合各类用户群体。

豆包Seaweed

豆包Seaweed是一款基于Transformer架构的AI视频生成工具,支持文生视频和图生视频模式,能够生成高逼真度、细节丰富的视频内容,广泛应用于电商、文旅、教育等领域,大幅降低视频制作门槛,提升创作效率。

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型,能通过分析普通手机拍摄的视频生成详细的 3D 场景布局,涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术,实现空间认知与语义标注,并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域,具备物理规则嵌入和结构化场景生成能力。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

哄哄模拟器

哄哄模拟器是一款利用AI技术提升用户情商和沟通技巧的应用。该应用基于Moonshot的Kimi智能助手大模型,融合了自然语言处理和人际交往的知识,通过模拟日常生活和恋爱中的沟通场景,帮助用户改善情感智慧和沟通能力。它支持网页版和iOS版本,具备模拟争执场景、文字交流实训、情感状态模拟、沉浸式音效、恋爱交往文本分析以及场景角色定制等功能。

Playwright MCP

Playwright MCP是微软推出的轻量级浏览器自动化工具,基于Model Context Protocol(MCP)协议,通过Playwright的可访问性树实现与网页的交互,无需依赖视觉模型或截图。支持多种浏览器,提供丰富的交互功能,如点击、拖动、输入文本等,适用于与大语言模型结合使用。具备结构化数据交互、网络请求管理、测试脚本生成等功能,支持无头和有头模式运行,适用于自动化测试、网页操作

klaviyo

Klaviyo 是一个面向电子商务和数字业务的全面营销自动化平台,集成了客户数据管理、个性化营销、短信与电子邮件营销及预测分析等功能。它通过整合多渠道数据,提供自动化营销流程和精准客户细分,帮助企业优化营销策略并提升客户价值。