学习

LeRobot

LeRobot是一个由HuggingFace开发的开源AI聊天机器人项目,旨在简化机器人技术的学习过程。它提供了预训练模型、数据集和模拟环境,支持模仿学习和强化学习,适用于多种机器人硬件。该项目具有多用途、可扩展的特点,通过提供预训练模型、数据集共享、模拟环境和多功能库等功能,帮助用户加速机器人项目的开发进程。

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具,它通过 TensorRT 技术实现了显著的性能提升,同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端,还能够部署于移动设备,满足多种应用场景需求,包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

Mistral Small 3

Mistral Small 3 是一款由 Mistral AI 推出的开源大语言模型,具备 240 亿参数,支持多语言处理,适用于低延迟场景。模型基于 Transformer 架构,支持长文本输入,具备高性能和本地部署能力。其可定制性强,适用于虚拟助手、客服系统、自动化任务及专业领域应用,如医疗和法律咨询。

FunGPT

FunGPT 是一款基于 InternLM2.5 大模型开发的开源工具,专注于情感互动与情绪调节。它包含“甜言蜜语模式”和“犀利怼语模式”,分别用于提升用户情绪和释放压力。项目采用轻量化模型与 AWQ 量化技术,兼顾性能与效率。适用于创意启发、娱乐互动等多种场景,适合对情感交互感兴趣的开发者和用户。

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略,将风格学习与一致性学习解耦,并支持与任意风格的 LoRA 模块集成,实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性,具备更高的灵活性和泛化能力,在实验中表现出与 GPT-4o 相当的性能。

GradeWiz

GradeWiz 是一款基于人工智能的教育辅助工具,可自动批改作业、生成评分标准并提供个性化反馈,显著提升教师批改效率与准确性。其功能包括作业识别、智能评分、教师审核、重批及数据分析等,广泛应用于研究生课程、个性化教学、远程学习和教学管理等领域,助力教育质量提升。

PixVerse V4

PixVerse V4 是一款基于 AI 的视频生成工具,支持通过文本或图片快速生成高质量视频,最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能,适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升,适合个人创作、广告营销、教育及影视娱乐等领域使用。

Argil

Argil是一款基于SOTA深度学习技术的AI视频生成平台,支持快速创建个性化AI克隆形象,适用于品牌推广、教育、娱乐等多种场景。平台提供丰富的虚拟形象和灵活的视频编辑功能,如机位控制、肢体语言调整等,提升视频吸引力与真实性。无代码操作简化创作流程,支持多语言及多平台适配,适合个人创作者与企业使用。

Autocut

AutoCut是一款开源AI视频剪辑工具,利用自动语音识别技术生成字幕并支持文本编辑功能,帮助用户高效剪辑视频片段。支持多模型运行及硬件加速,可输出SRT或Markdown格式文件,广泛应用于视频创作、企业培训、新闻报道、语言学习等多个领域。

GenieArt

一个基于深度学习的AI文本到图像生成模型,GenieArt主要用于生成以文本描述为条件的详细图像和插画。在这里您可以享受低门槛地创作,所想即所得,方便快捷地展现您脑海里的画卷