AI项目与工具

NotaGen

NotaGen 是由多所高校联合研发的音乐生成模型,基于预训练、微调和强化学习技术,可生成高质量古典乐谱。支持通过“时期-作曲家-乐器”等条件控制音乐风格,具备高度音乐性与可控性。采用 CLaMP-DPO 方法优化生成质量,无需人工标注。适用于音乐创作、教育、影视配乐等多种场景,提供多种模型规模选择,满足不同需求。

谛韵DiffRhythm

DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集,包含约20万个多模态样本,涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力,并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量,适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

TrendPublish

TrendPublish 是一款基于 AI 的趋势发现与内容发布工具,支持多源数据采集、智能处理与自动发布功能。通过集成 AI 服务,实现内容总结、标题生成和发布管理,适用于科技媒体、企业推广、学术研究等多种场景,提升内容生产效率与质量。

WiseMind AI

WiseMind AI 是一款基于 AI 的学习与知识管理工具,支持多种文档格式,可快速生成摘要、思维导图和智能笔记,提升信息处理效率。平台兼容多个 AI 大模型,提供翻译、海报生成、知识卡片等功能,并采用本地化存储保障数据安全,适用于学术、商务、语言学习等多场景。

Proxy Lite

Proxy Lite是一款开源的轻量级视觉语言模型,具有30亿参数,支持自动化网页操作。它通过“观察-思考-工具调用”机制,实现网页交互、数据抓取、表单填写等功能,适用于自动化测试、数据提取和智能任务辅助等场景。该工具资源占用低,可在消费级GPU上高效运行,适合开发者快速部署和使用。

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。

DiffBrush

DiffBrush是由多所高校与研究机构联合开发的图像生成与编辑工具,支持用户通过手绘草图直接控制图像生成过程。其核心技术包括颜色引导、实例与语义控制、潜在空间再生等,兼容多种主流T2I模型,如Stable Diffusion、SDXL等,并支持LoRA风格调整。该工具简化了AI绘画流程,提升了图像生成的精度与灵活性,适用于创意绘画、图像编辑、教育、游戏设计等多个领域。

GPTExcel

GPTExcel 是一款基于AI的电子表格辅助工具,支持公式生成、自动化脚本编写、SQL查询生成等功能,简化复杂数据处理流程。它提供详细解释,帮助用户理解和应用生成内容,并支持表格模板创建、数据可视化和正则表达式生成,适用于多种应用场景,如财务、数据分析和人力资源管理。

Platus

Platus 是一款基于人工智能和无代码技术的法律服务平台,提供文件起草、审查、签署与公证等自动化功能。其智能分析可识别关键条款并确保合规性,支持工作流自定义和API集成,适用于企业法律流程优化、合规管理及跨国业务需求,提升法律处理效率与安全性。