AI

Photoroom

免费的ai背景抠图工具,感觉比remove.bg效果更好。

青梧字幕

青梧字幕是一款基于AI语音识别技术的字幕提取工具,能够从视频中精准提取语音内容并生成时间轴字幕。支持多语言识别、多格式导出及多语种翻译,适用于视频创作者、外语学习者及字幕团队。所有数据处理在本地完成,保障隐私安全,兼容Windows和MacOS系统,提升字幕制作效率。

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型,结合音频、视觉和文本信息,提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构,通过指令调整增强情感处理能力,并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异,适用于人机交互、教育、心理健康、客户服务等领域,具有广泛的应用前景。

VoltAgent

VoltAgent 是一个开源的 TypeScript 框架,用于构建和编排 AI Agent。它提供基础架构和工具,简化与大语言模型的交互、状态管理、外部工具连接及工作流编排。支持多 Agent 系统、记忆管理、RAG 技术、语音交互等功能,并具备可视化监控和灵活的 LLM 支持,适用于智能客服、数据处理、语音控制等多种场景。

华知大模型

由同方知网与华为强强联合打造的华知大模型,是一款针对知识服务和科研领域,以权威性和可信度为突出特点的内容平台。

Adspert

Adspert 是一款基于AI的电商广告优化工具,适用于亚马逊、eBay 和 Google 等平台。它通过智能算法自动调整出价、优化关键词和广告投放,帮助用户降低广告成本并提升投资回报率。提供数据仪表盘、跨市场优化和场景预测分析功能,提升广告管理效率,适用于各类电商平台卖家和营销人员。

Glean AI Agent

Glean推出的企业级实用平台,能借助自然语言创建并部署AI代理,实现各类工作任务与业务流程的自动化,而且员工不用写代码就能轻松创建和使用这些代理。

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具,支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构,结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制,有效避免多主体混淆,确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景,提供高质量、个性化的图像生成能力。

华知大模型5.0

华知大模型5.0是一款由同方知网与华为云联合开发的多模态人工智能平台,支持文本、图像等多种数据类型的处理与生成。其核心功能包括AIGC检测、学术搜问、图表解读、论文选题、文献理解以及知识推荐等,广泛应用于科技创新、学术研究、科学决策及数据分析等领域,致力于提升工作效率并促进智能化发展。