AI项目与工具

FlexIP

FlexIP 是腾讯推出的图像合成框架,支持在保持主体身份的同时进行个性化编辑。其双适配器架构分离身份保持与编辑功能,结合动态权重门控机制实现灵活控制,并通过多模态数据训练提升生成质量与稳定性,适用于艺术创作、广告设计、影视制作等多个领域。

Botgroup.chat

Botgroup.chat 是一款支持多人 AI 交互的聊天平台,用户可自定义 AI 角色并进行群聊互动。平台兼容多种 AI 模型,支持实时对话、Markdown 排版及数学公式显示,具备上下文记忆和角色管理功能。项目基于 React 和 Cloudflare Pages 构建,部署便捷,代码开源,适用于语言学习、创意讨论等多种场景。

AiPathly

AiPathly是一款面向希望进入AI领域的专业人士的综合性平台,提供个性化技能评估、定制学习路径、职业匹配报告及实时行业洞察等功能。用户可通过模拟项目积累实践经验,并借助简历和作品集优化服务提升求职竞争力。无论是职业转型者、技能提升者还是学生群体,均可借助AiPathly实现高效成长与成功转型。

GitHub MCP Server

GitHub MCP Server 是一款基于 Model Context Protocol (MCP) 的服务器工具,支持与 GitHub API 无缝集成,提供自动化工作流、问题管理、代码审查等功能。它可提升开发效率,简化仓库操作,并支持与多种开发工具集成,适用于代码管理、数据分析及智能审查等场景。

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型(MLLM)。它通过整合视觉、语音和文本三种模态的信息,实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据,还支持流式文本-语音生成及跨模态信息交互,适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具,支持从教育材料中提取文本、公式、表格等结构化数据,输出为JSON或Markdown格式,准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术,支持多语言处理,适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

Symbolab

Symbolab 是一款基于AI的数学解题工具,支持从基础算术到高等数学的广泛领域,提供分步解题、智能图表生成、多语言输入及个性化学习建议等功能,适用于学生、教师及专业人士,提升数学学习与应用效率。

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架,采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容,第二阶段通过流匹配技术提升至1080p,仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用,适用于广告、影视、教育等领域。

FitDiT

FitDiT是一种基于Diffusion Transformers架构的高保真虚拟试穿技术,通过服装纹理提取器和先验演化技术精确捕捉服装细节,同时采用扩张-松弛掩码策略优化尺寸适配。它能在短时间内生成高质量的试穿图像,适用于电子商务、时尚设计、个性化定制以及增强现实等领域,为用户提供逼真的虚拟试穿体验。

Kolors Virtual Try

Kolors Virtual Try-On 是一款基于深度学习技术的 AI 虚拟换衣工具,能够分析用户上传的照片并智能适配服装,生成逼真的试穿效果。主要功能包括 AI 虚拟换衣、自动适配光线和阴影、支持多种服装和风格、快速生成效果图以及个性化试穿体验。该工具适用于在线购物、时尚搭配、内容创作和电商营销等多种应用场景。