学习

改写匠ReWriter

一款基于AI和深度学习技术的英文写作智能批改工具,可以帮助用户提升英语写作水平,避免中式英语,增强逻辑衔接性,优化语言表达,提升文章质量。

CineMaster

CineMaster是快手推出的3D感知视频生成框架,支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术,结合语义布局控制网络与摄像机适配器,提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

Glyph

Glyph-ByT5-v2是一个由多家知名学术机构合作开发的多语言视觉文本渲染工具。它支持10种不同语言的视觉文本渲染,通过构建包含大量字形-文本对和平面设计图像-文本对的数据集,结合先进的步骤感知偏好学习技术,显著提升了视觉文本的拼写准确性和审美质量。该工具适用于平面设计、广告制作、数字艺术、出版行业及品牌标识设计等多个领域。 ---

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。

MindNow思维导图

MindNow思维导图是一款简单易用高效的思维导图软件,适用于头脑风暴、思维整理、学习笔记和会议记录等多种场景使用。

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。

AniTalker

AniTalker是一款先进的AI工具,能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态,采用通用运动表示和身份解耦技术减少对标记数据的依赖,同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式,并具备实时控制动画生成的能力。

Awesome Screenshot

一款集屏幕录制、截图和编辑于一体的强大工具,特别适用于远程工作、在线学习和内容分享。

3MinTop

3MinTop 是一款基于人工智能的阅读辅助工具,可将书籍内容提炼为3分钟精华摘要,帮助用户高效掌握核心信息。支持智能问答、多语言翻译及思维导图生成,适用于学生、专业人士、阅读新手等各类用户。通过科学的学习激励机制,助力用户建立持续阅读习惯,提升学习效率。