排序
InstantID:只要2张图片,一键生成独具风格的定制化照片
InstantID简介InstantID是一种基于扩散模型的图像生成技术,由小红书的InstantX团队开发。它能够在不需要大量训练的情况下,仅通过一张参考图像生成具有各种风格和姿势的定制化图像,同时保持高...
Stable Video Diffusion:手搓视频,3步生成电影级画面
Stable Video Diffusion简介Stable Video Diffusion是Stability AI发布的视频生成大模型,基于Stability AI原有的Stable Diffusion文生图模型,Stable Video Diffusion可实现文生视频。应用场...
社恐新嘴替:7款AI语音工具哪家强?
伴随着AI文生语音技术不断发展,无论是文生语音、AI调音(换风格)还是语音克隆,基本上都已经堪任社恐人群的“嘴替”。但在一票主流AI应用中间,各款有何异同,到底哪款好用呢?今天就来一起看...
SkyReels-A1:影帝级微表情,拉Sora下神坛
伴随着AIGC、短剧等内容创作的风靡,市场对视频生成、数字人等AI应用的需求也在逐步提升。诸多产品不开源、价格高、不好用、不精细等痛点凸显,随着昆仑万维SkyReels-A1的全面开源,精细表情数...
AniPortrait:视频或音频驱动,人人都是歌手!
你是否曾盯着屏幕上的歌手幻想:要是自己也能在聚光灯下深情演唱该多好?一个能让静态照片”开口唱歌”的神奇工具,正凭借视频与音频双重驱动能力,赋予每个人成为”虚拟歌手”的魔法。只需上传...
照片说话大杀器:SadTalker 助你化身“泽圣”,“声”动全球!
一、 时代风云变幻,观点即是灯塔!身处百年未有之大变局,国际局势波谲云诡,每一天都充满着不确定性。在这个信息爆炸、众声喧哗的时代,拥有独立思考,发出时代强音,比以往任何时候都更加重...
FishSpeech:中日英文生语音,自然流畅
不少AI语音合成软件的生成作品都缺乏“人味”,而流畅自然的语音交互体验却逐渐被更多AI应用场景所需要。今天要介绍的就是Fish Audio出品的一款文本转语音(TTS)解决方案——FishSpeech,其在...
方言语音克隆哪家强?阿里CosyVoice放大招
没人能想到在AI应用领域,中国公司也终于能弯道超车、扬眉吐气一把。阿里开源的语音大模型CosyVoice(语音生成),主打多语言、情感丰富,支持零样本语音克隆和跨语言转换,光是“更懂中文”这...
Live Portrait:照片整活,一键安排!
在图、文、视频等各种介质之间换脸换头,已经不算是AI届的新鲜事。但今天要为大家推荐的Live Portrait的好玩之处,是可以让静态照片里的人物甚至动物,拥有活灵活现的表情,而这一切只需要简单...
CogVideo:强大的高清视频生成工具
CogVideo简介CogVideo 是由 智谱 AI 联合清华大学开发的开源视频生成模型,其升级版 CogVideoX 于 2024 年发布,集成于智谱的 AI 视频生成工具 清影(Ying) 中。该模型基于多模态技术,支持通...
AI知识科普①:AI的定义、起源、发展、案例
大家好,今天的更新是AI科普系列的第一期。 首先我们要知道:AI和人工智能是完全一致的概念,AI即Artificial Intelligence是人工智能英文单词的缩写。(在所有以后的分享中,作者将优先使用汉语...
大模型训练烧钱无底洞?DeepSeek V3 用「省钱秘方」撕开行业新口子
训练一个千亿参数的大模型需要花多少钱?OpenAI 曾透露,GPT-4 训练成本超过 1 亿美元,这还不包括后续优化和推理的开销。对中小企业来说,这简直是「天价门槛」。但最近 DeepSeek 团队的一篇论...
FaceFusion:一看就会的AI换脸软件
“AI换脸”作为AI冲浪时代诸多软件的主流功能,看似随处可见,但用户真正到使用的时候,却不得不面临着:不知道去哪个平台找软件,开源代码包部署太复杂,操作流程对普通人不友好,用户界面不懂...
赚钱利器!推荐几个适合小红书博主的 AI 应用
在竞争激烈的小红书平台,博主们需要不断提升创作效率和质量,才能脱颖而出。AI 技术的发展为我们提供了强大的助力,今天就给大家推荐几个适合小红书博主的 AI 应用,让创作变得轻松又高效,成...
PhotoMaker:一脸在手,百变我有
一、PhotoMaker是什么?PhotoMaker是一个由南开大学和腾讯PCG实验室开发的人工智能系统,它的核心功能是文生图,同时允许用户通过调整特定的参数来定制生成的图像。比如,在人脸不变的前提下,...
            
        
        












