AI项目与工具

Red_Panda

Red_Panda 是一款由 Recraft AI 开发的先进 AI 图像生成工具,以其高精度的文本到图像转换能力和卓越的解剖学准确性著称。它能够生成复杂长文本对应的高质量图像,支持用户通过风格控制和图形设计工具实现个性化定制。此外,Red_Panda 还具备矢量图像生成能力,并集成 AI 图像编辑功能,广泛应用于设计、品牌营销、教育及出版等多个领域。

Fluently

Fluently 是一款基于AI的英语学习工具,能够根据用户水平生成个性化学习计划,涵盖发音、语法、词汇和流利度训练。用户可在真实场景中与AI导师进行对话练习,并获得即时反馈。支持Zoom等主流会议平台,帮助用户在实际交流中提升英语表达能力,适用于面试模拟、日常练习、国际交流等多种场景。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

Pixelfox

Pixelfox 是一款基于AI技术的在线图片编辑工具,支持背景移除、AI换脸、图像修复、图片放大等多种功能。用户无需下载软件,直接在浏览器中上传图片即可快速完成编辑。操作简单、处理高效,适用于摄影、电商、社交媒体等多个领域,适合各类图像处理需求。

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型,支持文生视频与图生视频,具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构,性能卓越,尤其在Vbench评测中表现领先。提供专业版与极速版,适应不同场景需求,已开源并支持多种框架,便于开发与研究。

DuoAttention

DuoAttention是由MIT韩松团队提出的新型框架,通过区分“检索头”和“流式头”两种注意力机制,显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用,加速了解码和预填充过程,并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。

maket

Maket是一款基于生成式AI技术的建筑设计工具,主要功能包括自动化生成楼层平面图、设计风格探索、设计元素定制等。它通过虚拟助手为用户提供材料、成本和设计方案的专业建议,同时简化法规遵守流程,确保项目合规性。此外,Maket支持快速生成概念设计并提供即时合规反馈,有效提升设计效率与质量。

INFP

INFP是一款基于音频驱动的头部生成框架,专为双人对话设计,具备自动角色转换功能。它通过两个阶段实现头部生成:基于动作的头部模仿和音频引导的动作生成。同时,INFP提出了大规模双人对话数据集DyConv,推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景,支持实时互动并可调节生成风格。

STORM AI

STORM AI 是一款由斯坦福大学开发的开源AI写作工具,能够快速将一个主题转化为长篇文章或研究论文。它利用大语言模型(LLM)进行多角度提问和模拟专家对话,生成深入且准确的内容。STORM AI 可以自动收集资料、生成大纲,并最终形成完整的文章。其主要功能包括基于互联网搜索撰写文章、多角度提问、模拟专家对话、生成研究大纲以及引用和参考资料管理。此外,STORM AI 还能够自动化研究过程,为写