AI
FunAudioLLM
FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。
Durable AI建站工具
Durable AI,专业AI建站工具,只需点击三下,在一分钟内生成一个设计完整的网站,让你的业务上线,其中包含文本、图像和表格。毫不费力地自定义你的网站。简单的编辑工具、多个页面和免费的自定义域。无需代码基础。
10WEB人工智能建站
10Web是一个基于Elementor的人工智能驱动的网站建设工具,提供类似于WordPress的块状编辑器,并增加了安全功能、后端优化和AI工具。
DesignEdit
DesignEdit是一个由微软亚洲研究院和北京大学的研究人员共同开发的AI图像编辑框架。它采用了多层潜在分解和融合技术,能够实现对象移除、移动、调整大小、翻转、相机平移和缩放等复杂图像编辑任务。DesignEdit还支持跨图像元素的组合,特别适用于设计图像和海报的编辑。通过关键掩码自注意力机制和伪影抑制方案,DesignEdit能够在不破坏图像整体连贯性的情况下,实现高精度的空间感知图像编辑。
Seaweed APT
Seaweed APT是字节跳动研发的对抗性后训练模型,支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练,实现单步高质量输出,包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计,结合近似R1正则化技术,提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。
