生成
PhotoDoodle
PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架,能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略,结合位置编码重用和无噪声条件范式,确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能,并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源,适用于数字艺术创作、商业设计、社交媒体等多个场景。
Verifier Engineering
Verifier Engineering是一种创新的后训练方法,通过搜索、验证和反馈三个阶段优化基础模型性能。它采用目标条件马尔可夫决策过程(GC-MDP),结合线性与树搜索算法,对模型输出进行动态调整。其验证器分类涵盖多种形式和粒度,并支持基于训练和推理的反馈方式。这项技术已在自然语言处理、代码生成、教育和内容安全等领域展现广泛潜力,成为提升模型鲁棒性和智能化水平的重要工具。
谛韵DiffRhythm
DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。
