AI项目与工具

Pidgeon

Pidgeon是一款利用人工智能技术的新闻聚合应用,主要功能包括生成简洁的新闻摘要、整合全球新闻资源、支持多语言及个性化定制。用户可通过智能分类筛选新闻内容,并享受无广告干扰的阅读体验。此外,Pidgeon还提供离线阅读和多模式切换功能,适用于快速获取全球资讯的用户。

SmolLM2

SmolLLM2是一款由Hugging Face研发的紧凑型大型语言模型,支持设备端运行,具有1.7B、360M、135M三种参数规模。它通过监督微调与超反馈优化提升指令理解能力,在文本重写、摘要生成、函数调用等方面表现突出,适用于智能助手、聊天机器人等需要自然语言处理的场景,尤其适合延迟敏感、隐私保护和硬件资源受限的应用。

AlphaFold 3

AlphaFold 3 是一款由 DeepMind 开发的基于深度学习的 AI 工具,能够准确预测蛋白质、核酸、小分子等多种生物分子的三维结构。它在药物设计、疫苗研发、基础科研以及疾病研究等领域展现出强大的应用潜力。通过创新技术如 Pairformer 模块和扩散模块,AlphaFold 3 实现了更高的预测精度,并支持复杂生物系统的建模。

Click2Mask

Click2Mask 是一种创新的图像编辑工具,通过点击操作实现局部内容的高效编辑。它采用动态遮罩生成技术,并结合混合潜在扩散(BLD)模型及基于 CLIP 的语义损失,使用户无需复杂操作即可完成图像编辑。该工具支持局部内容添加、自由形式编辑等功能,适用于数字艺术创作、照片编辑、社交媒体内容制作及广告设计等场景。

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架,基于稀疏体积表示和空间稀疏注意力(SSA)机制,提升扩散变换器(DiT)的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器(SS-VAE),支持多分辨率训练,在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状,具有精细几何细节和高

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具,其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品,并通过质量控制确保输出结果的高保真度。此外,QA-MDT支持音乐与文本的一致性增强,适用于广告、影视配乐、音乐教育及智能设备等多个领域。

Future You

Future You是一款由麻省理工学院开发的AI对话工具,通过生成用户60岁后的虚拟形象,让用户与其互动交流,增强对未来自我的连续感。它结合了自然语言处理、机器学习和图像处理技术,帮助用户在个人发展、职业规划、教育、心理咨询及财务规划等领域实现更好的决策和规划。

Stagehand

Stagehand 是一款基于自然语言处理的 AI 工具,专注于网页自动化操作。其核心功能包括自然语言驱动的 `act`、`extract` 和 `observe` API,支持原子化指令执行和多模型适配。Stagehand 可实现网页测试、数据抓取、表单操作及内容监控等多样化任务,广泛应用于网页测试、数据分析、办公自动化等领域。

SignLLM

SignLLM是一款支持多语言手语生成的AI模型,能将文本转换为自然流畅的手语视频,覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景,提升听障人群的沟通便利性与信息获取能力。

Step1X

Step1X-Edit 是由阶跃星辰团队推出的通用图像编辑框架,结合多模态大语言模型与扩散模型,支持多样化的图像编辑任务,如主体修改、背景更换、风格转换等。用户可通过自然语言指令进行操作,系统能精准理解并生成高质量图像。该工具基于大规模数据集训练,具备强大的真实场景适应能力,适用于创意设计、影视制作、社交媒体等多个领域。