模型

Krea AI

Krea AI是一款由AI驱动的AI创意工具,可以生成图像和视频,设计工具,满足创意需求。

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型,参数量降至 3.41 亿,适配移动设备和边缘计算场景。基于深度学习与模型压缩技术,支持快速生成音效、音乐片段等音频内容,适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点,可用于音乐创作、游戏音效、视频配乐等领域。

BitsAI

BitsAI-CR是字节跳动推出的基于大型语言模型的自动化代码审查工具,采用两阶段处理流程提升审查精度。通过219条规则检测潜在问题,并结合“过时率”指标动态优化规则。支持多语言审查,可无缝集成到现有流程中,自动识别问题、生成评论并跟踪修改情况,提升代码质量与开发效率。

LVCD

LVCD是一款基于视频扩散模型的AI工具,专门用于动画视频线稿的自动上色。它通过参考注意力机制和创新的采样方法,确保视频颜色的一致性和时间连贯性,支持生成长时间序列动画。LVCD广泛应用于动漫制作、游戏开发、影视行业以及艺术创作等领域,显著提升动画制作效率。

多面鹅

OfferGoose是一款基于AI的面试助手,旨在提升求职者的面试表现。它提供实时面试提醒、AI模拟面试、智能押题和深度复盘等功能,支持多语言和多种行业需求。无论是技术岗位还是非技术岗位,OfferGoose都能帮助用户增强技术能力和沟通技巧,提供定制化的面试建议和职业发展支持。

达闼RobotGPT多模态大模型

达闼RobotGPT多模态大模型是一个创新的AI工具,它通过整合多模态数据处理能力,为机器人在多样化的应用场景中提供了强大的交互和行为生成能力。

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。

CausVid

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术,基于自回归生成模型和蒸馏预训练技术,实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段,优化了视频生成的质量与稳定性,适用于内容创作、新闻报道、教育培训、游戏开发及广告营

文心大模型4.5

文心大模型4.5是百度推出的原生多模态大模型,具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理,适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台,企业与开发者可通过API调用,满足多样化业务需求。

North

North 是 Cohere 推出的企业级 AI 工作平台,提供安全、高效的 AI 解决方案,支持私有云或本地部署。内置 Compass 搜索系统,可处理多种数据类型并支持多语言,提升任务效率。平台集成了高性能语言模型和自动化工具,适用于金融、医疗等行业,可用于风险评估、客户支持、疾病诊断、药物研发等多个场景,增强企业智能化水平。