AI项目与工具

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架，支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控，具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能，广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 596 浏览

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型，拥有 21 亿参数，支持多模态输入（文本、图像、视频、音频），并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持，适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署，支持 4 位量化以降低资源占用，适合广泛的应用需求。

AI项目与工具 2025年06月12日 70 点赞 0 评论 596 浏览

Songburst

Songburst是一款基于AI技术的音乐生成工具，用户可通过描述音乐风格或情感来生成原创音轨。该工具支持多场景应用，包括视频、播客、游戏等，并可将音乐导出至Spotify和Apple Music等平台。用户能够无限次下载生成的音乐文件，同时借助提示增强器优化生成效果，提升创作效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 596 浏览

Talkpal AI

Talkpal AI是一款利用GPT技术构建的语言学习平台，支持多语言学习，包括英语、西班牙语、法语和德语等。其主要功能涵盖自适应学习系统、角色扮演、情景对话、听力及口语练习，并提供即时反馈，助力用户提升语言实际应用能力。

AI项目与工具 2025年06月12日 36 点赞 0 评论 596 浏览

星火快答

星火快答是科大讯飞推出的AI智能交互系统，集成了虚拟人、语音识别、大数据分析等功能，适用于展厅、会议、营销等场景。支持多模态交互、知识问答、数据可视化与跨屏联动，提升信息传递效率与用户体验。

AI项目与工具 2025年06月12日 86 点赞 0 评论 596 浏览

MobileLLM

MobileLLM是一款针对移动设备优化的大型语言模型，具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术，在低参数环境下实现高效性能，适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 596 浏览

图怪兽

图怪兽是一个集在线图片编辑与设计于一体的多功能平台，提供多样化的模板资源，涵盖多种应用场景。通过AI技术支持的颜色搜索和一键抠图等功能，大幅提高设计效率。该平台支持多终端同步使用，模板版权合规，适合各类用户群体，让设计工作更加高效和简便。

AI项目与工具 2025年06月12日 62 点赞 0 评论 596 浏览

LaTRO

LaTRO（Latent Reasoning Optimization）是一种用于提升大型语言模型推理能力的框架，通过将推理过程视为潜在分布采样并采用变分推断方法进行优化，无需外部反馈即可增强模型生成高质量推理路径的能力。该框架支持自奖励机制、联合学习及梯度估计等技术，广泛应用于数学问题求解、科学问题解答、编程任务、逻辑推理以及自然语言理解等领域，有助于构建更智能、更自主的问题解决系统。

AI项目与工具 2025年06月12日 45 点赞 0 评论 597 浏览

MedGemma

MedGemma是谷歌推出的开源AI模型，专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告，27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署，适用于医疗诊断、患者分诊、临床决策辅助等场景，提升医疗服务效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 597 浏览

讯飞智聘

讯飞智聘是科大讯飞推出的智能化招聘管理平台，整合AI技术与大数据能力，提供从职位发布到人才入职的全流程服务。核心功能包括AI面试、智能简历解析、人才库管理、招聘助理、内推管理等，适用于社会招聘、校园招聘、猎头服务等多种场景，提升招聘效率与精准度。

AI项目与工具 2025年06月12日 49 点赞 0 评论 597 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间