GeneralDyG GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法,适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块,有效捕捉动态图的多尺度特征,具备高适应性和计算效率。实验证明其性能优于多种主流方法,具有广泛的应用前景。 AI项目与工具 2025年06月12日 95 点赞 0 评论 444 浏览
MangaNinja MangaNinja是一款基于参考图像的线稿上色工具,采用Reference U-Net和Denoising U-Net架构,结合补丁重排模块与点驱动控制方案,实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题,广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。 AI项目与工具 2025年06月12日 66 点赞 0 评论 444 浏览
海螺AI视频 多功能的AI助手,通过提供视频创作、音乐创作、图像识别和文本写作等功能,帮助用户提升工作和学习的效率。它的智能化和高效率的特点,使其成为提升生产力的有力工具。 Ai视频生成 1970年01月01日 0 点赞 0 评论 443 浏览
MagicColor MagicColor是一款由香港科技大学开发的多实例线稿图着色工具,基于自监督训练和实例引导模块,实现高效、精准的色彩分配。支持参考图像驱动,具备实例级控制与边缘增强功能,适用于动画、数字艺术、游戏开发等领域。采用扩散模型与双UNet架构,提升着色质量和效率,适合创意设计与教育应用。 AI项目与工具 2025年06月12日 49 点赞 0 评论 443 浏览
QLIP QLIP是一种基于二进制球形量化(BSQ)的视觉标记化方法,具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略,QLIP可作为视觉编码器或图像标记器,广泛应用于多模态任务,如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率,为统一多模态模型的开发提供了新思路。 AI项目与工具 2025年06月11日 18 点赞 0 评论 443 浏览
Ideogram 2.0 Ideogram 2.0 是一款文本到图像的AI工具,能够将文字转化为高质量的视觉内容。该工具支持多种风格选择,包括写实、设计、3D和动漫,具有强大的语义理解能力和先进的文本渲染技术。通过Magic Prompt功能,用户可以输入中文提示词并自动翻译优化。此外,该工具还提供API和搜索功能,支持用户和开发者进行深度集成。 AI项目与工具 2025年06月12日 38 点赞 0 评论 442 浏览
LatentLM LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。 AI项目与工具 2025年06月12日 67 点赞 0 评论 442 浏览
Yodayo Yodayo 是一个面向动漫爱好者和虚拟主播的在线AI艺术创作平台,主要功能包括文本到图像生成器、模型选择、探索页面以及虚拟聊天室。用户可以通过输入文本提示词,利用AI技术生成高质量的动漫风格图像。该平台鼓励创意分享和社区互动,提供直观的用户界面和先进的AI技术,激发用户的创意灵感。 AI项目与工具 2025年06月12日 45 点赞 0 评论 442 浏览