AI项目与工具

Auphonic

Auphonic是一款利用人工智能技术的在线音频后期处理工具,提供自动音量平衡、降噪、混响减少、滤波、静音剪切等功能,适用于播客制作、广播电台、电影视频制作等多个场景,支持多语言语音转文字及视频章节生成,提供免费和多种付费订阅方案。

ResearchFlow

ResearchFlow是一款基于AI技术的学术研究工具,结合白板与思维导图功能,帮助用户高效组织和探索学术内容。其核心功能包括AI驱动的学术搜索、可视化思维导图构建、深度研究支持、文档标注与交互分析,以及多格式参考文献支持。该工具广泛适用于学术研究、论文写作、项目报告、课程学习及市场研究等多个领域。

VectorVein

VectorVein 是一款开源的无代码AI工作流工具,通过简化拖拽操作,使用户无需编程知识即可构建智能工作流,实现日常任务的自动化。它支持数据处理、分析和知识管理等多种应用场景,具备无代码、AI驱动和可定制化等特点。VectorVein 旨在降低AI应用的门槛,提升个人和团队的工作效率,并提供本地部署和开源选项,以满足不同用户的数据安全和隐私需求。

Fin

Fin-R1是由上海财经大学与财跃星辰联合开发的金融领域推理大模型,基于Qwen2.5-7B-Instruct架构,通过两阶段训练提升金融推理能力。其支持金融数据推理、代码生成、风险控制、ESG分析等多种功能,具备多语言支持与轻量化设计,适用于智能风控、投资辅助、量化交易等场景。模型在权威评测中表现优异,具有较高的实用价值。

Fractal Generative Models

Fractal Generative Models 是一种基于分形架构的图像生成技术,通过递归调用“原子模块”实现逐像素生成高分辨率图像。该模型结合 Transformer 模块,采用分而治之策略,大幅提升计算效率。不仅适用于图像生成,还可扩展至分子结构、蛋白质等高维数据建模,具有广泛的应用潜力。

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架,基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动,适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构,提升生成效果与稳定性,广泛应用于影视、游戏、教育、广告等领域。

Piclumen

Piclumen 是一款基于AI的图像生成工具,支持文本转图像、图像风格化、背景移除及图像修复等功能,可生成多种艺术风格的高质量图像。其高分辨率输出和便捷操作使其广泛应用于社交媒体、广告设计、艺术创作、游戏开发及教育领域,适合各类用户快速实现视觉创意。

aftershoot

Aftershoot 是一款基于 AI 的摄影辅助工具,支持快速筛选和自动编辑照片,适用于婚礼、活动、人像等多种摄影场景。它能识别重复、模糊或闭眼照片,并提供风格化编辑功能。用户可自定义 AI 编辑偏好,支持 RAW 和 JPEG 格式,兼容主流后期软件,提高工作效率。

ShowBiz AI

ShowBiz AI是一款基于BlackEye多模态视听大模型的专业级AI视频创作平台,专注于文本转动画、全流程AI赋能以及多种视频编辑功能。它支持从文案生成到分镜脚本设计再到编辑工具的一站式服务,涵盖横屏转竖屏、慢动作生成、抠像、扩图、擦除、高光处理、语音转写及语音生成等功能,旨在提升视频制作效率并降低创作成本,同时激发创意灵感。

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集,涵盖大量数学和科学内容,包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化,可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---