AI项目与工具

MewX AI

MewX AI是一款集文生图、图生图、艺术二维码生成及室内设计于一体的生成式AI平台,支持多种风格的艺术创作与设计任务。主要功能包括MX绘画、MX Cute、MJ绘画、边缘检测和室内设计,广泛应用于艺术创作、平面设计、插画制作等领域。用户可以通过简洁的操作流程快速生成高质量图像,并灵活调整参数以满足个性化需求。

千颜

千颜是一款依托AI技术的照片和视频编辑工具,提供多样化的穿搭风格与视频模板,支持用户快速生成写真照片和视频。其主要功能包括AI一键换装、海量风格模板、视频换装以及图片动态化处理,满足个性化创意需求。应用场景广泛,包括个人娱乐、社交媒体内容创作、教育学习等。

Gliglish

Gliglish 是一款基于 AI 技术的口语学习平台,通过语音识别和自然语言处理技术,模拟真实对话场景,帮助用户提升口语和听力能力。支持多语言学习,包括英语、中文、日语、韩语、德语、法语等,并提供即时语法和发音反馈。用户可调节对话速度,实现个性化学习。此外,Gliglish 支持多语言语音输入和输出,适合语言初学者及需要强化特定语言技能的学习者。

豆包AI视频模型

豆包AI视频模型包括PixelDance和Seaweed两款工具,分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动,适合制作情节丰富的短片;Seaweed支持多分辨率输出,生成高质量、高逼真的视频,适用于商业领域。两者均提供多样化的风格选择和输出格式,满足不同场景需求。 ---

ColorAI

ColorAI 是一个基于人工智能技术的配色工具,能够根据用户的创意和设计理念自动生成配色方案。它提供了多种配色方案选择,包括三元色、相似色、互补色、复合色和单色方案。该工具不仅能生成配色方案,还能解释为何这些颜色适合用户的需求,帮助用户即使没有设计背景也能选择满意的配色方案。此外,用户还可以根据自身需求进行颜色调整,获取最满意的配色效果。

Soundwave

Soundwave是由香港中文大学(深圳)开发的开源语音理解大模型,专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术,提升语音特征压缩效率,支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域,具有广泛的应用前景。

豆包AI编程

豆包AI编程是一款基于AI技术的编程辅助工具,支持一键上传代码、实时接入GitHub项目,并提供沉浸式代码阅读和精准提问功能。它能生成、解释、修复和优化代码,提升编程效率与理解力,适用于学习、开发、代码审查及团队协作等场景。

BeautyPlus

BeautyPlus是一款结合AI技术的照片编辑软件,支持iOS、Android及网页端操作。它提供AI图像生成、视频编辑、人像优化等功能,可将普通照片转化为创意艺术作品,并包含裁剪、格式转换、滤镜增强等实用工具,适用于社交媒体内容创作、个人肖像美化、艺术创作及商业用途等多个场景。

DiffSensei

DiffSensei是一款由北京大学、上海AI实验室及南洋理工大学联合开发的漫画生成框架,它结合了基于扩散的图像生成技术和多模态大型语言模型(MLLM)。该工具能够根据用户提供的文本提示和角色图像,生成具有高精度和视觉吸引力的黑白漫画面板,支持多角色场景下的互动与布局调整。其核心技术包括掩码交叉注意力机制、对话布局编码以及MLLM作为特征适配器等,广泛应用于漫画创作、个性化内容生成、教育和培训等领

Teacher2Task

Teacher2Task是一个由谷歌团队研发的多教师学习框架,其核心在于引入教师特定的输入标记并重新构建训练过程,以减少对人工聚合方法的依赖。通过将训练数据转化为多个子任务,该框架能够从不同教师的多样化预测中学习,提高模型的性能和鲁棒性,同时降低标签不准确性的风险。它适用于机器翻译、图像理解、自然语言处理等多个领域,显著提升了数据利用效率。