PixelHacker PixelHacker是一款由华中科技大学与VIVO AI Lab联合开发的图像修复模型,采用潜在类别引导机制,通过线性注意力实现结构与语义一致性的高质量修复。基于大规模数据集训练并经过多基准微调,支持多种图像类型与分辨率。适用于照片修复、对象移除、艺术创作、医学影像及文化保护等领域。 AI项目与工具 2025年06月11日 50 点赞 0 评论 469 浏览
TokenFD TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和 AI项目与工具 2025年06月12日 90 点赞 0 评论 469 浏览
FantasyTalking FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具,能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略,结合面部专注的交叉注意力模块和运动强度调制模块,实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态,适用于游戏、影视、VR/AR、虚拟主播及教育等领域。 AI项目与工具 2025年06月11日 83 点赞 0 评论 468 浏览
ZelinAI ZelinAI是一个AI应用构建平台,允许用户通过零代码方式构建自己的AI应用。它专注于Prompt学习和训练、AI参数调试等场景,并支持将模型打包为专属AI应用。此外,用户还可以通过分享... 创业营销 1970年01月01日 0 点赞 0 评论 468 浏览
Paper2Code Paper2Code是一款由韩国科学技术院与DeepAuto.ai合作开发的AI工具,基于多Agent大语言模型,能将机器学习论文自动转化为可运行的代码仓库。它通过规划、分析和代码生成三个阶段,确保代码结构清晰且忠实于原论文内容。该工具显著提升了科研复现效率,适用于研究、教学、工业等多个领域,具有高度实用性和准确性。 AI项目与工具 2025年06月11日 78 点赞 0 评论 468 浏览
AIOOTD AIOOTD是一款基于AI技术的时装生成平台,专注于将上传的服装照片转换为不同风格的AI时装图像,包括动漫、插画和写实风格。它支持图片上传、编辑、批量处理以及个性化定制,可直接适配社交媒体平台。该工具广泛应用于时装品牌推广、设计师作品展示、社交媒体内容创作及电商销售等领域,助力提升品牌形象和产品吸引力。 AI项目与工具 2025年06月12日 25 点赞 0 评论 468 浏览
ChatHi 一个大模型集成平台,ChatHi集成了国内外知名文生文大模型13家,文生图大模型5家,是一款人工智能聊天助手,专注于提供智能化的对话体验和全面的信息检索。 Ai平台模型 2025年06月05日 53 点赞 0 评论 468 浏览
Sa2VA Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型,结合SAM2与LLaVA技术,实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务,具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。 AI项目与工具 2025年06月12日 66 点赞 0 评论 468 浏览
Gemma 3n Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型,基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入,可生成结构化文本输出,并具备音频转录、情感分析等功能。可在本地设备运行,响应时间低至 50 毫秒,适用于语音助手、内容生成和学术任务定制。 AI项目与工具 2025年06月11日 87 点赞 0 评论 467 浏览
百度曦灵数字人平台 基于百度领先的数字人和人工智能技术,面向视频、直播、交互等全场景应用,让数字人赋能千行百业实现内容和服务的智能化升级。 Ai视频生成 2025年06月05日 97 点赞 0 评论 467 浏览