学习 - 智狐AI导航

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 602 浏览

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API，具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术，尤其是Transformer架构，来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域，为用户提供了一个全面而高效的AI解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 601 浏览

AppAgentX

AppAgentX是西湖大学开发的智能GUI代理框架，通过记忆和进化机制优化手机交互效率。它能自动归纳高效操作模式，减少重复计算，支持跨应用复杂任务。基于视觉识别，无需API即可通用操作，适用于自动化任务、智能助手、企业流程等领域。在多项测试中表现优异，为智能代理技术提供新思路。

AI项目与工具 2025年06月12日 28 点赞 0 评论 599 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 599 浏览

Stable Artisan是一款基于Discord平台的图像和视频生成机器人服务，利用Stability AI的AI技术和模型，如Stable Diffusion 3和Stable Video Diffusion，使用户能够通过自然语言提示生成高质量的图像和视频。此外，它还提供了一系列图像编辑工具，包括搜索替换、背景去除、高清放大、扩展外延、控制素描和结构等功能，适用于创意人士、设计师、内容创作

AI项目与工具 2024年01月01日 46 点赞 0 评论 599 浏览

Midjourney V7

Midjourney V7 是一款基于深度学习的 AI 图像生成工具，具备草稿模式、语音交互、实时编辑等功能，显著提升生成速度与图像质量。其支持个性化配置，可根据用户偏好优化输出结果，适用于艺术、设计、娱乐等多个领域。系统采用先进神经网络技术，实现文本到图像的精准转换，并提供多种运行模式以满足不同需求。

AI项目与工具 2025年06月12日 96 点赞 0 评论 598 浏览

Auto Backend

Auto Backend 是一个您只需几句话即可为您的 Web 应用程序生成后端的网站开发工具。

Ai编程建站 2025年06月05日 68 点赞 0 评论 598 浏览

纸质书:《动手学深度学习》

全球60多个国家400多所大学用于教学

Ai编程建站 2026年06月14日 0 点赞 0 评论 598 浏览

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型，包含文本转语音（Takin TTS）、音色转换（Takin VC）及声音风格变换（Takin Morphing）。它采用最新大型语言模型技术，可生成接近真人的高质量语音，并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域，具有音色精准、风格多样等特点。

AI项目与工具 2025年06月12日 63 点赞 0 评论 598 浏览

NoteGPT

NoteGPT是一款利用AI技术（如ChatGPT和Claude 3）开发的内容摘要工具，支持对YouTube视频、网页及PDF文档进行快速总结。其主要功能包括生成视频概要、提取关键点、制作思维导图、自动转录、笔记管理和多语言翻译等，广泛应用于学习、研究、职场和内容创作等领域，帮助用户高效获取和整理信息。

AI项目与工具 2025年06月12日 40 点赞 0 评论 597 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期