架构 - 智狐AI导航

Filmfotos

Filmfotos是一款基于Flux架构的LoRA模型，专注于模拟和还原胶片质感。其低饱和度的日系胶片风格适用于多种场景，包括人物、风景、静物、食物和动物等，能够提升照片的艺术感和复古氛围。Filmfotos利用LoRA技术、深度学习和图像处理算法，实现高精度的图像生成，适用于摄影爱好者、专业人士及创意工作者。

AI项目与工具 2025年06月12日 39 点赞 0 评论 923 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 513 浏览

OpenMusic

OpenMusic是一款基于QA-MDT技术的文生音乐工具，支持从文本生成高质量音乐作品，具备质量感知训练、多样化风格生成及复杂推理能力。它广泛应用于音乐制作、多媒体内容创作、音乐教育等领域，同时提供音频编辑与处理功能，旨在提升音乐创作效率和质量。

AI项目与工具 2025年06月12日 87 点赞 0 评论 762 浏览

豆包Seaweed

豆包Seaweed是一款基于Transformer架构的AI视频生成工具，支持文生视频和图生视频模式，能够生成高逼真度、细节丰富的视频内容，广泛应用于电商、文旅、教育等领域，大幅降低视频制作门槛，提升创作效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 552 浏览

豆包AI视频模型

豆包AI视频模型包括PixelDance和Seaweed两款工具，分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动，适合制作情节丰富的短片；Seaweed支持多分辨率输出，生成高质量、高逼真的视频，适用于商业领域。两者均提供多样化的风格选择和输出格式，满足不同场景需求。 ---

AI项目与工具 2025年06月12日 45 点赞 0 评论 666 浏览

MemoryScope

MemoryScope 是一款面向大型语言模型的长期记忆系统，通过向量数据库存储记忆片段，支持记忆检索、巩固及反思等核心功能。它具备时间感知能力，能提供个性化的交互体验，广泛应用于个人助理、情感陪伴、客户服务、教育辅导和健康咨询等领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 591 浏览

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型，集成了图像和文本处理能力，适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构，Molmo 72B在学术基准测试中表现优异，为开源AI技术的发展做出了重要贡献。

AI项目与工具 2025年06月12日 69 点赞 0 评论 641 浏览

TeleChat2-115B是一款由中国电信人工智能研究院开发的大型语言模型，具备强大的文本生成能力。它支持多语言处理，包括中文和英文，并且能够高效执行多种任务，如文本生成、代码编写、数据分析和语言翻译等。此外，TeleChat2-115B通过先进的架构设计，如Decoder-only结构和Rotary Embedding位置编码方法，提升了模型性能与稳定性。该模型适用于智能客服、内容创作、教育辅

AI项目与工具 2025年06月12日 23 点赞 0 评论 674 浏览

CDial

CDial-GPT是一项由清华大学研发的基于大型中文对话数据集LCCC的预训练对话生成模型。该模型提供LCCC-base和LCCC-large两个版本的数据集，并具备预训练、微调、多模态学习等功能，能够生成高质量的对话回应。其应用场景涵盖客户服务、智能助手、在线教育等多个领域。

AI项目与工具 2025年06月12日 63 点赞 0 评论 743 浏览

Lingua

Lingua是Meta AI推出的轻量级代码库，专注于大规模语言模型的训练与推理。它基于PyTorch框架，具有模块化设计、分布式训练支持以及灵活的自定义能力，适用于学术研究、工业部署及模型优化等多个领域。Lingua支持端到端训练、性能优化、多GPU协作，并提供丰富的工具来管理和保存模型。

AI项目与工具 2025年06月12日 71 点赞 0 评论 697 浏览

架构

首页

架构

列表

默认

浏览次数

发布日期