AI - 智狐AI导航

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 522 浏览

Writer

发现作家,AI写作团队的平台。...

生活创意 1970年01月01日 0 点赞 0 评论 523 浏览

Reclaim.ai

Reclaim 为您的团队的优先事项创建完美的时间表，并通过智能、灵活和自适应的时间编排节省高达 40% 的工作周时间。

创作工具 1970年01月01日 0 点赞 0 评论 523 浏览

Nanonets

使用人工智能实现手动数据输...

Ai编程建站 1970年01月01日 0 点赞 0 评论 523 浏览

DiffBrush

DiffBrush是由多所高校与研究机构联合开发的图像生成与编辑工具，支持用户通过手绘草图直接控制图像生成过程。其核心技术包括颜色引导、实例与语义控制、潜在空间再生等，兼容多种主流T2I模型，如Stable Diffusion、SDXL等，并支持LoRA风格调整。该工具简化了AI绘画流程，提升了图像生成的精度与灵活性，适用于创意绘画、图像编辑、教育、游戏设计等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 523 浏览

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动（VLA）模型，专为经济高效的机器人设计。拥有4.5亿参数，可在CPU上运行，单个消费级GPU即可训练，适合在MacBook上部署。它能够处理多模态输入，生成动作序列，并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 523 浏览

朱雀大模型检测

腾讯推出的一款专门用于识别AI生成内容的工具，主要应用于对生成的文本和图像的检测。

Ai平台模型 2025年06月05日 85 点赞 0 评论 523 浏览

Relay.app

Relay.app是一个强大的自动化平台，支持用户创建AI驱动的智能工作流，连接100多个常用应用程序。它提供直观的界面和“人在回路”功能，使非技术人员也能构建复杂的自动化流程。内置AI功能如内容总结、文本翻译和数据提取，以及自定义AI模型调用，满足多样化业务需求，提高工作效率和团队协作的流畅性。

AI项目与工具 2025年06月11日 36 点赞 0 评论 523 浏览

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 523 浏览

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型，专为大型语言模型设计，通过多轮对话实现检索规划与查询细化，具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色，支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

AI项目与工具 2025年06月12日 41 点赞 0 评论 523 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期