AI项目与工具

创意喵

创意喵是一款基于AI技术的内容创作辅助工具,主要功能包括一键生成创意标题和短视频文案,支持本地保存历史记录。它适用于社交媒体、视频制作、广告文案、博客文章及新闻稿等多种应用场景,助力内容创作者高效产出高质量作品。

AI外教

AI外教是一款利用人工智能技术的虚拟外教口语学习应用,提供个性化的一对一口语练习、实时语法纠错、发音评分及专项备考功能,覆盖雅思、考研、四六级等多种考试题库。此外,它还结合哈佛系统课和CEFR分级体系,帮助用户循序渐进地提高英语口语能力,同时提供翻译、写作辅助等智能工具。 ---

FaceFusion

FaceFusion是一款开源AI工具,支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术,FaceFusion能够实现精准的人脸识别与对齐,广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。

Comflowy

Comflowy 是一个专注于将 ComfyUI 工作流转化为实用工具的平台,提供超过 100 个预安装的扩展,支持多种主流 AI 模型,包括一些闭源模型。它具备强大的云 GPU 支持,用户友好的界面设计以及灵活的节点系统,帮助用户高效管理和生成高质量的工作流,适用于多种应用场景,如室内设计、快速手绘生成、艺术风格转换及视频生成等。

LHM

LHM是由阿里巴巴通义实验室推出的3D人体模型重建系统,能从单张图像快速生成高质量、可动画化的3D人体模型。基于多模态Transformer架构,融合3D几何与2D图像信息,保留服装与面部细节,并采用3D高斯点云表示方式,支持实时渲染和姿态控制。适用于AR/VR、游戏开发、影视制作及教育等多个领域,具备高保真、强泛化和低延迟等优势。

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量,并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术,适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

Telescope 2.0

Telescope 2.0是一款基于AI技术的销售线索生成平台,支持用户自定义搜索条件并借助AI算法优化结果,提升线索质量。平台拥有庞大的全球B2B数据库,涵盖9亿个人和5000万家企业信息,支持多渠道数据整合与实时更新,适用于销售、市场、业务拓展和招聘等场景,提升客户定位与外联效率。

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。

SoulChat2.0

SoulChat2.0是一款基于大语言模型的心理咨询师数字孪生系统,能够模拟真实心理咨询师的语言风格和技术,提高大模型在实际应用场景中的表现。该模型通过少量真实咨询案例快速构建,支持心理咨询师的工作,并促进心理健康大模型领域的研究发展。其核心功能包括心理咨询师数字孪生建模、低成本高效建模、辅助心理咨询以及开源合作。

SVDQuant

SVDQuant是一种由MIT研究团队开发的后训练量化技术,专注于通过4位量化减少扩散模型的内存占用和推理延迟。它利用低秩分支技术吸收量化异常值,支持DiT和UNet架构,并能无缝集成LoRAs。SVDQuant适用于移动设备、个人电脑、云计算平台及低功耗设备,可大幅提升图像生成和处理效率。