深度学习 - 智狐AI导航

GPT学术优化

GPT学术优化是一款专为学术研究与写作设计的开源工具，提供论文翻译、代码解析、信息提取、LaTeX校对、论文润色及摘要生成等功能。其模块化设计支持灵活扩展，通过大型语言模型实现高效的语言处理任务，适用于学术研究、教育辅导、项目开发和技术文档撰写等多个场景。

AI项目与工具 2025年06月12日 58 点赞 0 评论 923 浏览

Filmfotos

Filmfotos是一款基于Flux架构的LoRA模型，专注于模拟和还原胶片质感。其低饱和度的日系胶片风格适用于多种场景，包括人物、风景、静物、食物和动物等，能够提升照片的艺术感和复古氛围。Filmfotos利用LoRA技术、深度学习和图像处理算法，实现高精度的图像生成，适用于摄影爱好者、专业人士及创意工作者。

AI项目与工具 2025年06月12日 39 点赞 0 评论 922 浏览

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统，支持37种语言，具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传，准确度高，适用于国际会议、商务交流、教育等场景，支持译文长度调节和设备兼容，提升跨语言沟通效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 922 浏览

Astria AI

Astria是一个利用生成AI创建定制图像的平台。Astria AI允许用户上传一组主题的图像，然后根据文本提示生成新图像。

Ai绘画生成 2025年06月05日 28 点赞 0 评论 921 浏览

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具，可将视频中的唇部动作转换为文字，支持多语言和口音识别。其高精度算法确保了文字输出的准确性，适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便，处理高效，注重用户数据隐私保护，适合专业用户和普通用户使用。

AI项目与工具 2025年06月12日 100 点赞 0 评论 921 浏览

I2V

I2V-01-Live是一款基于深度学习技术的图生视频工具，可将静态二维图像转化为动态视频，具有高度流畅的动作表现和多样化的艺术风格适配能力。其核心功能包括动态呈现、动作效果增强及稳定的表情管理，广泛应用于社交媒体、广告营销、动画制作、教育培训以及游戏开发等领域。

AI项目与工具 2024年12月06日 82 点赞 0 评论 914 浏览

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统，融合视觉-语言-动作模型，支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力，适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练，结合真实操作与多模态信息，实现高效、灵活的机器人控制。

AI项目与工具 2025年06月12日 17 点赞 0 评论 912 浏览

面灵AI

面灵AI是一款基于DeepSeek大模型的智能面试辅助工具，支持实时问题解析、个性化面试策略生成、多场景模拟面试及面试反馈报告等功能。其覆盖200+行业高频场景，提供多语言支持，适用于求职者提升面试技巧、熟悉流程并优化表现。用户可通过官网注册并选择不同套餐进行使用。

AI项目与工具 2025年06月12日 29 点赞 0 评论 912 浏览

Motion Dreamer

Motion Dreamer是由香港科技大学（广州）研发的视频生成框架，采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制，支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能，已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 903 浏览

TryOffAnyone

TryOffAnyone是一款基于Latent Diffusion Models技术的AI工具，专注于从人物照片中提取服装区域并生成平铺展示图。它具备在线图片处理、智能服装识别、背景去除和图像优化等功能，广泛应用于电商平台的商品展示、个性化推荐、库存管理和图像检索等领域，帮助提升用户体验和运营效率。

AI项目与工具 2025年06月12日 41 点赞 0 评论 897 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期