MegaTTS 3 MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统,采用轻量级扩散模型,支持中英文及混合语音合成,具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模,可快速生成高质量语音,适用于教育、内容制作、语音交互等多个领域。 AI项目与工具 2025年06月12日 29 点赞 0 评论 438 浏览
AnyStory AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具,支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构,结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制,有效避免多主体混淆,确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景,提供高质量、个性化的图像生成能力。 AI项目与工具 2025年06月12日 42 点赞 0 评论 438 浏览
FreeCodeCamp 一个非营利性开源编程学习平台,可以帮助人们免费学习编程。freeCodeCamp 提供丰富的编程学习内容,包括HTML、CSS、JavaScript、Python、SQL等多种技术和框架。 Ai学习资源 2025年06月05日 83 点赞 0 评论 438 浏览
北京邮电大学人工智能学院 北京邮电大学强大的“信息黄埔”实力,充分利用学院的多学科交叉特色,注重理工融合、科教融合、产教融合,守正创新,努力打造一流的人工智能人才培养和科技创新基地。 教育学习 1970年01月01日 0 点赞 0 评论 439 浏览
DianJin DianJin-R1是由阿里云与苏州大学联合开发的金融领域推理增强型大模型,基于CFLUE、FinQA和CCC等高质量数据集训练,通过监督微调和强化学习优化,提升金融任务的推理能力。模型支持结构化输出,具备高效推理与低计算成本优势,在合规检查、金融问答、考试辅助等领域表现优异,适用于多种金融应用场景。 AI项目与工具 2025年06月11日 68 点赞 0 评论 440 浏览
FlashMLA FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核,针对 NVIDIA Hopper 架构 GPU 优化,提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度,内存带宽达 3000 GB/s,算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务,具备高性能与低延迟特性,支持快速部署与性能验证。 AI项目与工具 2025年06月12日 12 点赞 0 评论 440 浏览
子曰 子曰-o1是网易有道推出的国内首款支持分步式讲解的推理模型,采用14B参数轻量化设计,适配消费级显卡,在低显存设备上运行稳定。通过思维链技术模拟人类思考过程,输出详细解题步骤,特别适合教育场景,如K12数学教学和AI学习辅助。其具备强逻辑推理能力和自我纠错机制,支持启发式学习,提升用户理解与自主学习能力。 AI项目与工具 2025年06月12日 39 点赞 0 评论 440 浏览