学习 - 智狐AI导航

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 442 浏览

清图

清图 - 模糊图片秒变清晰，一个基于深度学习技术的在线图像处理平台

图片处理 1970年01月01日 0 点赞 0 评论 442 浏览

CopyTranslator

一款免费开源的复制即翻译的外文辅助阅读翻译工具，支持复制即翻译，能够解决多余断句和换行带来的乱码问题，翻译结果更符合阅读习惯。

Ai办公效率 2025年06月05日 82 点赞 0 评论 440 浏览

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架，基于扩散变换器（DiT）模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成，具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景，具备广泛的适用性和技术先进性。

AI项目与工具 2025年06月11日 31 点赞 0 评论 440 浏览

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

Ai平台模型 1970年01月01日 0 点赞 0 评论 440 浏览

BING翻译

输入网址则可启动网页全翻译功能

Ai语音工具 1970年01月01日 0 点赞 0 评论 439 浏览

WiseFlow

WiseFlow 是一个开源的 AI 信息挖掘工具，可以从网站、微信公众号、社交媒体等多源信息中智能提取并分类数据。该工具结合了统计学习和大型语言模型（LLM），优化了对微信公众号文章的解析，并支持多种新闻页面的处理。WiseFlow 设计轻巧，无需 GPU 即可运行，适用于任何硬件环境，是信息过载时代的信息管理理想助手。

AI项目与工具 2025年06月12日 48 点赞 0 评论 439 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 439 浏览

企鹅读伴

企鹅读伴是一款专为中小学生设计的AI阅读辅助工具，依托腾讯混元大模型与元器平台，提供个性化书目推荐、多模式阅读、互动提问、角色扮演及游戏化激励等功能。通过“阅读-思考-创造”闭环设计，提升学生的阅读兴趣与语文核心素养，适用于日常学习、家庭共读、教学辅助及教育资源补充等场景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 439 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 439 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期