模型

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

CursorCore

CursorCore 是一款基于大型语言模型的编程辅助工具,通过对话式交互支持代码补全、修改和错误修复。它整合代码历史、上下文信息及用户指令,利用自动化数据生成管道和基准测试优化模型性能,适用于日常编码、代码审查、教学学习及遗留代码维护等多个场景。

BlueLM

BlueLM-V-3B是一种针对移动设备设计的多模态大型语言模型,结合了高效算法与系统优化,支持快速、低功耗的文本与图像处理。其主要特性包括多模态理解、实时响应、隐私保护、高效率部署及跨语言能力。该模型通过动态分辨率调整、批量图像编码及令牌下采样等技术,实现了在有限资源下的高性能表现。

Bestprompts

一个中文行业prompt收录网站。 一个全行业AI会话辅助工具,为各行业的内容创作者提供全面准确的提示语。

智谱AI

智谱AI开放平台,GPT人工智能模型,基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式。

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术,基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示,适用于电商、设计、社交及品牌推广等场景,提升用户体验与决策效率。

同花顺·问财

同花顺·问财大模型是一款集合了实时数据获取、深度语义理解、专业投资建议、数据可视化和内容安全控制等多功能的智能投顾工具。

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具,支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型(LLM)技术,确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中,帮助简化本地化流程,适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

Gemma 2

Gemma 2是一款由谷歌DeepMind开发的开源人工智能模型,提供90亿和270亿参数版本。它具有卓越的性能、高效的推理速度和广泛的硬件兼容性,适用于各种应用场景。Gemma 2不仅支持多种AI框架,还提供了丰富的资源和工具,以支持开发者和研究人员负责任地构建和部署AI。

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架,通过“3D Bundle Image”结构实现多视角图像与法线图的融合,从而高效生成和编辑3D模型。它支持文本与图像输入,具备3D编辑、网格优化和纹理增强等功能,适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。