00:06
各位线上的朋友们大家好,欢迎参加腾讯云中小企业在线学堂系列直播活动,我是本次会议的主持人张小平。中小企业在线学堂围绕中小企业业务需求,聚焦企业经营管理、应用工具、技术创新、安全底座四大需求场景,推出系列直播课程,全面助力中小企业数字化升级。随着AIGC的发展和商业化的应用,越来越多的企业实现了效率的提高。以营销为例,通过纹身图和纹身纹等产品,营销内容的数量和质量都得到了大幅的提升。更进一步,通过深度结合前沿技术与业务场景,也有助于企业继续探索新鲜的玩法和丰富的场景,实现用户的留存与增长。
01:00
那么,如何利用AIGC实现迭代速率的更新,同时降低门槛?如何打破接入的门槛,更简易的实现部署与落地,本期直播将为您一一解答。在会议过程中,如果您有任何的疑问,欢迎您在问答区提问,嘉宾老师会在最后的QA环节为您解答,您可以通过聊天窗口发表您的意见和建议,期待您的反馈。首先有请今天的第一位分享嘉宾,腾讯云行业解决方案专家张一鸣。张老师拥有多年互联网广告和医疗行业的创业经验,致力于将先进技术与业务实际相结合,为企业创造价值和创新。曾服务过多家社交娱乐行业的头部客户,成功实施了多个AIGC相关场景的解决方案。今天张老师的分享主题是基于腾讯云智能构建AIGC应用场景,有请。
02:11
好的,呃,谢谢主持人啊,呃,很高兴啊,今天有这个机会在这里,在我们中小企业在线学堂来给大家介绍一下我们腾讯云智能构建AIGC的一些应用和场景。呃,那我是张艳明,前面主持人也已经介绍过了,这边就不赘述了。那我们就进入我们主题,腾讯云智能的AIGC能力介绍,那这是第一部分的内容,那呃,AIGC从去年开始啊,火爆出圈也是,呃让传统的一些内容创作模式成本大大降低,那呃,从字面上理解啊,AIGC是相对于PGC和UGC的这样一种内容创作模式,呃通过AI来去生成内容,那其实我们换一个角度,呃,AI其实呃我们也可以把AIGC当成是一种呃内容创作的基座,它是可以辅助我们在PGCUGC啊呃各方面去提升我们内容创作的一个效率。
03:11
那呃过去短短一年时间,AIGC已经快速的渗透到了各行各业,呃,包括像电商啊,游戏啊,广告以及是呃整个的互联网行业都是被AI快速颠覆,那现在AIGC其实我们可以看到也是在呃快速的渗透到呃其他的一些传统的电信,金融啊,媒体啊,教育啊各行各业。呃,那么接下来我们看一下我们腾讯云智能啊,在AI和AI方面提供的一些能力啊,过去啊,就是我们已经对外提供了超过300种的,呃,AI的原子能力,包括像文字识别啊,语音识别啊,图像理解啊等等,那通过这些能力呢,我们让机器可以去认识和理解外部世界。那么现在随着AIGC的快速发展,我们也提供了各种各样的生成式AI的能力啊,比如说啊,在图像生成方面,我们提供了像AI绘画以及人脸的融合和变化等等,那视频方面呢,我们也提供了人像驱动,呃,视频的修复啊,智能的视频的剪辑啊一些能力,在文本方面,呃,我们有智能创作助手啊,以及有我们的混员大模型,那还有在语音,我们也是有声音工坊,还有智能音乐啊这样一些产品能力。那另外一方面呢,AIGC现在也是逐步往多模态的这个方向在发展,呃,也就是说可以结合像文本、图片呃,视频啊,语音等等来去完成。呃一些场景啊,比如说像数字人就是呃很典型的也是今年最近比较火的一个场景了,呃,我们后面也是有同志同事会来给大家专门介绍一下数字人这个产品。
04:55
另外呢,呃,我想很多人也知道,今年九暂呃,我们也正式公布了我们的会员大模型啊,以及我们的模型技服,也就是masss整个能力,那MAS呢,也是依托于腾讯云的太机器学习平台,打造了行业大模型的精选商店,来提供一站式的大模型服务,那这个商店里面首先当然有我们自己的混员大模型,同时我们也是全面接入了像拉ma布ma这20多个主流的模型,可以一键的去部署和调用这些模型,来满足呃我们客户的一些多元化的一些需求。
05:33
那么呃,接下来我们再看一下AI的一些应用场景。那互联网的一些主要内容载体就是呃,包括文本啊,图片,音频和视频,那AGC,其实呃,就像我们前面看到的,我们一些原子能力其实已经渗入到这些主要载体的一些生产中,比如说在文本方面,呃,它可以帮我们去撰写一些文案,呃可以帮我们写代码啊,甚至可以成为一个客服和我们的呃用户来进行一些知识的一些问答,多人的对话啊,以及像翻译啊,标注啊等等。
06:09
那这都是文本生成的一些比较典型的场景,那在图片方面呢,AIGC,他也可以成为一个设计师啊,或者是成为一个画手,在奥迪亚也啊,以及包括3D方面来做一些设计的一些工作。那在音频方面,有声阅读是一个很,呃现在已经很常见的一个场景了,那包括在语音播报啊,呃,另外在音乐生成,配乐生成方面,呃,音频生成AI都AIGC都在这方面有很强大的一些能力和场景,那最后呢,在视频方面啊,其实AIGC的能力也是在快速的发展,呃,包括像虚拟偶像的一些视频呃,智能的一些剪辑啊,人脸的融合啊等等啊,所以其实我们可以看到AGC,呃也是给我们创造了呃很多很有趣的一些新玩法。
07:00
那么呃,我们先来看一下在图片生成啊呃那呃AI绘画其实是腾讯云智能的一款呃图像生成的产品,那它是用自愿自研的纹身图,呃作为一个我们基础的一个算法内核啊,目前已经可以提供数十种模型供客户来选择,那同时当然我们也可以根据我们的需要来定制一些风格。那呃基于纹身图这样的一个呃能力啊,其实也可以带来很多新的一些社交玩法啊,比如说左上角这个呃,我们可以呃上传我们自己的头像,然后通过纹身图呃以及图生图来去生成不同风格的啊一些头像啊,比如说漫画画的啊这种头像,那而且也可以是呃把一些视频转换成图的风格啊,那比如说这边是有一些视频,但因为呃我们在直播这个呃,现在呃那个视频播放可能会有一些卡顿,那我就不播放了,但其实可以看到我们是可以把视频也转化成一些漫画的一些风格,或者是一些呃其他的一些风格。
08:03
那最右边神笔马良,呃这个是我们天晴实验室的一个呃产品,是结合纹身图和直播呃推出的一个增值服务,那用户在这里面呢,呃,它可以呃输入一些文字,那根据这个文字来生成一些呃千人千面,千变万化的礼物,呃那这样的话,呃每个用户他生成的一些礼物都是个性化的,呃那推出之后也是很受到我们的呃用户和主播的欢迎。那另外呃,图片在像虚拟社交啊,数字分析啊,模特十一方面都有很多的应用,像虚拟社交是很多用户都有的一个情感陪伴的一个需求,那这个场景其实也是结合了文本图片以及语音的一个综合性的场景,那数字分身呃,我相信很多人也玩过啊,今天有个APP叫妙丫。那呃通过上传呃十几20张图片,那可以给你去呃生成一些很个性化的呃一些呃不同场景下的一些呃那个写真或者照片,比如说这边就是一个美食证件照。
09:09
那像电商呃,今年也算是AIGC进入电商的第一个双11的元年啊,也是刚刚过去的双11,那对电商来讲,一方面是营销,很多企业已经结合AI啊,呃结合呃语言模型和这种纹身图去生产营销的文案啊和各种呃营销的图片,那另外一方面大家也知道呃图片其实对电商商品的销量是有很大影响的,那现在其实呃每个商家都可以通过LGC呃花很快的时间就可以去生成一张很漂亮的商品图片,而且这个商品图片在不同的场景可以很容易去变换,比如说如果我的服装要去中东卖,那我可以换一个中东的模特,在中东的场景啊,几秒钟就可以完成。那还有比如说说像游戏啊,漫画等等,呃,都有AIGC的场景,那像游戏的一些角色制作,那我们其实已经可以在创意阶段,让A帮助美术去快速完成一些2D的稿件的设计啊,包括在C的建模贴图方面,我们也是在进行尝试。
10:13
那另外在漫画我们也是尝试了基于漫画IP来定制一些模型,那通过这个模型再来生成漫画作品。呃,然后呢,我们再来看一下视频生成方面啊,呃,那人脸融合其实在社交娱乐方面是一个很有意思的呃场景,比如说左下角这个,那这张照片是静态的,但是通过人像驱动啊,我们可以让这个呃人动起来啊,甚至再配上音乐,可以有一个很好的娱乐效果,那除了这种娱乐的一些场景啊,在营销方面其实也是呃大有用处啊,那比如说呃,我们有一个营销视频,那通过这样一些呃人脸的融合啊等等,呃,其实类似于换脸吧啊比如说这第三个视频,其实就是第一张照片的人脸,呃结合到第二张视频里面的呃生成的这样一个视频,那这个视频我们就可以去应用到一些不同的场景。
11:11
那最后呢,像通过AI来生成文案,结合语音来驱动,像小样本数字啊,其实这也是现在一个很常见的一个场景,那这块我们后面同事也是会来介绍了。那在音频生成方面,呃云智能云啊已经在很多行业里面有比较成熟的一个应用了,比如说像呃小说T书啊,有声剧场啊,资讯播报等等场景,那结合不同的场景,我们还提供了不同类型的音色可以来选择,当然也可以至于呃客户的需求来定制特有的一些音色。那在音乐生产方面,我们也可以基于文字的方式来去描述一些音乐特征,比如说我可以生成一段呃,舒缓的、放松的这样一些音乐,它就会来生成一段呃,比较舒缓的可能是钢琴曲。
12:02
那呃像呃这第二张图片,呃,TX music也是我们腾讯的一个应用,它也是结合了音乐生成,人脸融合,还有一些小游戏的,和一个很有意思的这样一个场景。那当然我们也可以进行像歌声合成啊,音乐转化等等,包括在一些AI的视频剪辑里面,我们可以根据视频的一些内容来去生成,自动生成一些呃,视频的配乐。啊,甚至我们可以根据一段音乐来生成一些舞蹈动作,那通过绑定谷歌,谷歌的一些信息吧,啊,这个呃,视频就可以驱动数字人去跳舞,那这个也是很有意思的,在比如说像一些虚拟偶像场景里面,其实是呃呃很有用处。那我们再来看看文本生成方面啊,呃,那呃前面也提到呃,我们腾讯也是在九月份刚刚发布了呃,混元大模型。那这也是我们腾讯自主研发的一个大模型啊,有比较强大的这样一个中文创作的能力啊,包括在复杂语境下啊,可以去做逻辑推理的能力,还有一些任务执行的能力,那我们也知道很多的大模型啊,会有一些呃幻觉的一个问题啊呃,腾讯的这个混员大模型也是可以有效的降低幻觉的比例,呃相比国内的其他大模型啊呃是更加的成熟可靠。
13:25
那源其实不仅仅能够生成文字,其实也包含混身图这样一个模型,可以去生成图片啊,并且是在腾讯内部的各个场景啊,也都有应用,比如说像腾讯会议,呃,像以前我们开完一个会,那要去写会议记录,其实也是一个很麻烦的一件事情,那呃,依托会员大模型,那腾讯会议现在可以很快速的给一个会议去生成这样一个会议记录。那再比如在腾讯广告内部,呃也有很多呃,通过呃会员大模型去生成一些营销用的一些文案啊,图片啊等等啊,另外像包括像在腾讯的文档啊等等各方面,其实会员大模型都已经接入,并且有呃很广泛的一个应用了。
14:12
那然后呃,这是我们腾讯的一个智能创作助手的这样一个产品,其实它的背后也是我们的呃会人大模型,那它可以协助我们呃进行一些呃语法的用词的修正啊,风格化的一些文本续写,文本润润思啊等等,那对创作者来讲啊,它可以很大程度上提升效率,把文本应用在一些像文文学创作啊,呃新闻的报道啊,广告的一些文案啊,包括博客内容的写作啊,编辑啊等等场景,呃都可以呃有很大的一些呃有很大的效率的提升。那也是基于大模型多模态的这样一个理解和推理能力,我们也可以针对文档音频视频啊这些内容啊进行归纳总结啊,其实也类似于前面啊,刚提到的啊,腾讯会议的这样一个会议总结的一样啊能力。
15:05
呃,那么很多人可能也知道我们腾讯的,呃,一个愿景就是用户为本,科技向善,那么AI作为最前沿的这么一个科技啊,呃,AI向善其实呃也是很重要的,特别是现在很多人会担心AI会产生一些就不太好的一些内容吧,呃,包括在知识产权啊,呃,环境啊,技术伦理啊等等啊,都会有一些担心,那么我们腾讯云也是和天宇安全深度合作,来给大家提供安全合规呃健康可持续和高质量的这样一个服务,那最后也是希望我们秉持科技向善,AI向善的愿景,一起来推动科技创新,来助力我们整个行业的可持续发展。嗯,好的,呃,我的分享呢,就到这里啊,也谢谢大家。好的,谢谢张老师的精彩分享,有想和讲师交流问题的朋友请在问答区留言。接下来的分享嘉宾是腾讯云智能行业解决方案专家黄玉乾。
16:06
黄老师具有多年海内外AI产业落地的实践经验,致力于打造先进技术能力与业务场景相结合的产品与解决方案,提供AI大模型和数智人的方案咨询,服务过多家互联网、传媒、零售等领域的头部客户,目前负责腾讯云泛互联网行业AI产品的相关工作。欢迎黄老师带来快速打造企业数字人,一小时拥有属于自己的数字分身份,有请。谢谢主持人,很高兴今天能够在这里跟大家分享一下我们腾讯云关于呃,快速打造这个数字分身的这样的一个解决方案。那今天呢,我大概会从我们腾讯云智能的数据源产品介绍,以及如何去快速定制数据源分身,和我们相应的一些这个案例上啊,从这方面跟各位进行相应的一个分享和介绍。
17:05
那首先呢,是说数字行业期,实际上现在已经呈现出了一个非常高速的发展态势,那最早出现的数字人其实在上世纪的80年代就已经开始萌芽了,那在21世纪初的时候呢,开始啊,大众开始接触到了比较知名的一些数字人,比方说初音未来对在近五年呢,那数字更多的亮相了荧幕上,亮相在了我们的当中,这是由于呢,我们有了更多的这个度学习算法,并且制作的整个流程呢,有了大幅度的一个简化,那当前阶段呢,我们认为它是在一个啊负责行业是在一个加速的阶段当中,各种商业化的模式呢,它其实逐步的开始应用落地,并且技术呢有了全面的提升,那根据啊,某些相关的这个媒体啊。统计和报道的显示呢,当前应该说我们这个2021年到2026年这个五到六年的时间当中,每一年数字源行业的市场都会是以超过50%的这样的一个啊,同比增长的一个规模啊,迅速的向上进行增长,他预计呢,在2026年的时候呢,我们中国AI数字的这个市场规模可以超过100亿元。
18:18
这其实是相当大的一个市场,所以呢。我们其实也针对于这样的一个市场进行了相应的这个啊分析,我们发现数字人其实可以应用在非常多的行业领域和非常多的应用场景当中,比方说银行资管,保险这一类的金融领域,以及说传媒和市场,公共服务,生活服务,甚至我们的互联网当中的非常多的这个啊,虚拟偶像啊,虚拟直播啊,以及这个MCN机构的一些这个。短视频主播都可以利用啊,我们的这个数字人去帮助他们带来一些更多的一个变量,比方说我们以传统的B端客户为例,那这些传统的B端客户呢,可以借助我们的数字人去打造他们自己的虚拟品牌,虚拟的这个品牌代言人,去打造他们自己的啊企业独有的这样的一个虚拟偶像或者是虚拟主播,那同时呢,可以利用这样的一些虚拟主播或者虚拟客服呢,去帮助他们大幅度的减少啊一些相关的人力客服的投入啊。
19:22
更好的去帮助他们做到降本增效的这样的一个啊目的,那对于一些嗯,小B或者是大C,比方说一些啊大的up主来说,那数字人呢,其实也对他们来说带来了更多的一些行业机会,他的话呢,受众更广,而且普惠化的趋势呢,其实也更更明显,比方说我们有一些医生,律师等等这样的一些专业人士,他们会以视频的形式进行知识分享,但是他们自身呢,由于工作也比较忙,也比较难抽出那么多的时间去准备一个短视频,或者说是长期的保持在一个非常稳定的视频输出水平上,所以这个时候利用数字人能够帮助他们。
20:04
极大程度上的减少他们自己的工作负荷,而且可以解决有的有部分的这个啊。主播对于镜头呢,其实是有一些不适感,那这样的一些困扰呢,都可以由数字人帮他进行解决,那同时呢,我们还可以看到,对于未来那更多的啊普通的C端的用户来说,随着我们啊大圆模型的发展,那3D数字人的形象生产,以及2D小样本数字人的形象的这个快速的迭代,那未来可以说我们普通的人也可以拥有自己的数字分身,或是数字伴侣,或者是数字助手,那在未来的很多的呃,实际的C端应用场景下,我们都可以获得非常好的这样的新的一个体验,带来非常全新的这样的一个感受。那腾讯呢,也正是看到了在这个行业当中未来的广阔的一个发展前景,再结合我们腾讯自身的一些技术积累,去帮助企业去打造啊,属于企业自己的这样的一个数字员工,那希望能够引领企业的服务呢,做一个智慧升级,处理整个的数字化转型,那同时呢,啊,其实在人机交互的时代开始,那腾讯就一直有了相应的这样的一个啊技术的积累和沉淀,从文本语音,再到语音客服,再到当前的这个数据的数字员工。
21:29
那这是一脉相承的,总体来说呢,一直在提高沟通效率和啊提升这个服务温度上面呢,腾讯是不遗余力的,而且在这个过程当中,我们已经积累了非常多的相应的技术,比如说多模态建模,相应的语音的arts的技术,或者是啊自然语言处理的技术啊知识图谱的这个知识库的建建设能力,以及相应的这个啊视觉的技术去做对应的这个表情识别,以及对应的这个形象的驱动,那这在这些方面呢,我们都已经有了非常成熟的一个技术积累,这也是为什么我们腾讯能够把数字人做好的一个重要的原因,那在过去的几年当中呢,腾讯一直是在这个数字人行业当中啊算是一个引领者,那在一八年的时候呢,我们就业界首发了我们的这样的一个数字人啊,那在二零年的时候呢,又做到了3D主播的一个首发,是联合新华社推出的全球首个3D主播,那在二二年的时候,在冬奥会当中,我们呢,又首发了这样的一个。
22:30
手语的这个啊,3D的主播。对,所以在整个的过程当中呢,一直都在坚持不断的去创新,不断的去啊为这个行业注入一些新的活力,那总体来说我们的数据人可以分为呃两个大的交互呃类型,一个呢是单向的交互类型,一个是双向交互类型,那单向交互类型呢,就是我们传统的这种播报式,它一般呢,会被用在一些虚拟的主播或者是啊一些这个短视频播报,或者是教育课件的这个啊演播过程当中,那交互式的呢,它一般来说会出现在一些流程办理或者客服咨询当中,那交互式呢,经常是属于属于这种一对一的服务,在业务的这个场景当中呢,为客户去提供啊一对一的这样的专门性的服务,那可以呢,结合我们这个ARLP的技术,去提供更有温度的这样的一个真人的。
23:26
人的这样的一个贴身的服务,那能够更好的去帮助我们在这个一对一的服务场景下呢,啊使数字。更有温度,让客户的这个整体的用户体验呢,得到一个大幅度的提升,那播报型的场景呢,其实是啊,属于是一种一对多的服务,它其实啊基本的这种使用方式呢,是用文本或者是用语音去驱动数字内容进行一个播报,去提升整个的一个内容生产的一个效率,这个流程呢,其实就是说我们去选择对应的一个主播的一个形象,设置好你在这个视频当中需要去展现的背景或者是logo。
24:04
然后呢,再将你的这个编辑的播报内容,或者是你的这个语音啊输入进去,数责人就会根据你的这个语音和你设定的文本啊做出对应的口型,它会最终演绎出来你所需要的啊这样的一个短视频,然后你可以将这个短视频投放到相应的短视频平台,或者是放在自己的应用当中对外进行发布,那去起到一个啊广而之的一个作用。那从形象上进行区分呢,我们的数可以分为2D形象和3D形象,2D形象当中呢,可以区分为2D的小样本形象和2D的精品,象2D的小样本形象呢,主要针对的是快速的去定制属于自己的这样的一个数字分身的这样的一个场景。它能够更好的呢啊去凸显我们在这个啊负责人行业当中的快速性和这个生产力上的一个提升,以及我们对于这个啊性价比的一个体现,那这对于2D精品形象来说呢,它可以更好的去啊为我们的一些特定的啊服务场景去做出一些特定的这个动作,能够更好的去匹配比如说啊保险,比如说这个啊证券咨询等等这样的一系列啊需要比较多的这个一对一高精度服务的这样一些场景,那对于3D形象来说呢,我们也可以提供啊3D卡通,3D风格化,以及3D写实,以及最像真人的3D超写实这样的多种的例行分段的形象啊,供客户自行选择。
25:41
那我们的这个腾讯云智能的数据人呢,整个呢会分成啊几个大的层次,第一个层次呢,是我们自己的一个生产的平台,它包括了我们的形象的生成工厂,包括2D的这个真人数字人的一个生成,也包括了3D数字人的一个生产,以及对应的这个啊2D3D的全品类的下扩散,以及呢,我还有一个驱动中枢,这个驱动中枢呢,就可以啊,让我们用文本或者是这个分机去对数字人进行相应的一个口型和动作上的一个驱动,那我们还有一个多模的这个交互底座,多模交互底座的作用其实是对于啊人像这个手势以等式进行一个交互模式的一个体现提升。
26:27
那在应用平台上呢,我们其实提供了多种的这个接入方式,包括说啊这个pass的接口形式,以及SDK这种接入方式,那除此之外呢,我们还提供了对于交互数字人和播报数字人来说呢,会有这样的一个啊配置管理的这样的一个平台,帮助我们是对于生产形象的生产,以及啊数据人在这个视频生成过程当中的一些相关的啊设置进行配置的这样的一个界面。那在这个啊,在在此之上呢,是我们的这个场景和应用的这样的一个啊层次,这个层次呢,更多的是结合我们自己客户以及我们伙伴自己需要去进行使用的这样的一个场景,去进行相应的一些应用化的一个定制,那最上面则是我们这个行业的覆盖了,那目前来说其实已经覆盖到了包括啊金融、传媒,文旅等等这十余家的一个行业。
27:22
那第二部分呢,我会再次的跟大家介绍一下,如何去定制这样的一个数字分身,那小我在此呢,会以这个啊。小样本数字人的定制流程啊,作为一个啊基本的一个举例,首先呢,我们需要去制作这样的一个视频的素材,那它可能会需要去录制一个一段三到五分钟的真人的一个口播视频,如果是像通用口型的版本,我们一般来说只需要提交一分钟以上的这样真人口播的一个啊真人的视频即可。那第二点呢,是需要去取得这个用户形象的一个合法授权,那可以让用户以口述的形式,或者以书面的形式提交对应的材料,那第三点呢,是将这个素材通过API接,或者是在我们数平台上进行一个上。
28:10
最后呢,我们会在数字平台上产生对应的一个DEMO效果,然后让客户进行相应的确认,确认完这个效果之后呢,会把这个训练好的数字人绑定在用户的账号里,让用户呢,可以在平台上或者是利用API接口进行对应的数字调用。那这里呢,要简单的介绍一下我们的视频拍摄的一个基本的一个呃要求啊,其实大体上呢和啊我们正常拍摄的一个要求可能没有太大的这个差异,那主要呢是说第一啊需要有,如果说咱们需要是啊更换对应的这个视频背景的话呢,需要有一个绿幕,如果说咱们已经确定好视频的背景啊是什么样子的,那可以在这个啊确定好的背景前进行拍摄,那这样的话呢,啊也不需要绿幕啊会更加的方便一些,那同时呢啊,我们对于专属口型和通用口型会有区分啊,专属口型呢,是指说我们会根据。
29:09
啊,用户上传的这个视频去可啊预测他可能在说不同的文字,不同语音的时候,他的口型变化是什么样子的,那通用口型是说我们已经训练了海量的这样的一个数字人,那这些数字人根据他们的,我们已经把他的这个唇型,把他的这个口型完全的给复刻下来了,那这些唇型和口型的未来在啊其他的类似脸型的数字上呢,我们会对它进行一个使用,这样的话呢,可以让啊。一些可能嘴型不不是那么美观的,或者是啊。在这个,呃。口齿上不是那么清晰的这样的一些数字,人在进行说话的时候呢,可以利用这些更加啊通用的唇形口型进行一个替换,这样的话呢,可以大大的减少我们需要拍摄的这样的一个难度,以及呢去对于一些口型不太美观的这样的形象去做一个相应的修正。
30:11
对那啊,对于专属的口型来说呢,我们会要求他需要去连续的话三到五分钟,那讲的内容呢,可以是自己熟悉的文本。那如果是通用的口型呢,需要去拍摄一个全长超过一分钟的视频,那在这个过程当中呢,就不需要去进行收音了,模特的话呢,如果愿意说话也可以,如果啊不想说话的话,也可以进行自然的一个静默状态,毕竟嘴唇即可对。啊,对于这样的呃两这样的小样本视频来说呢,在提交了数字人之后呢,我会对他进行相应的训练和建模,对于通用口型来说,我们可以小级的快速得到这样的一个啊通用口型的小样本的一个数字人,那如果是专属口型呢,需要一到两个工作日进行相应的训练,以及对应形这样的一个审核。
31:00
在建完之后呢,我们即可登录到我们的这个系统当中,行对应的这个形象确认和目前呢的这个小小样本的数字人,以及对应的三数字人已经在各个行业当中去啊进行落地应用了,在这里呢,也跟各位啊分享一下我们在啊不同客户那里的一些应用的情况。首先呢,这里分享的是一个萨型的一个企业,它是专注于中小微企业的营销解决方案的一家公司,它的主要的任务呢,其实是利用我们的这个数字人去打造一个快速。可以高低成本高效率产出这样的一个数字人形象,帮助企业呢去实现啊快速生成口播短视频的这样的一个目的,然后呢,快速的去布局短视频的一个营销矩阵,那根据这个客户实测下来呢,其实我们当前的方案已经帮他能够去降低口播视频的创作成本超过90%,同时呢,提高他的这个效率超过90%,而且他目前已经有了超过啊100个火锅的模板和行业的形象,有非常强大的这样的新媒体的一个矩阵的运营能力,可以让啊用户创作的视频呢,基于不同的账号,不同平台去生成这样的一个举证码,然后呢,在各个部门的协同下面,只需要去扫码就可以进行快速这样的一个对应分。
32:23
那第二个这样的,呃,案例呢,是我们的一个金融的一个客户,那金融的客户呢,他其实专注于说做财富的零售服务领域的一个创业公司,那他的话呢,其实是啊,打造了一个场景化的模板方案,结合小样本的数字人制作代理人的一个数字分身,去提升代理人与这个在线上跟这个客户沟通的时候的一个亲切程度,来释放了啊投资顾问的一个生产力,去提升了整体的一个营销转化率,就根据客户的一个统计呢,它的营销转化率呢,其实是有那个五倍以上的一个提升,而且它能够实现整个流程。
33:01
线上化进行操作,全面的去释放投资顾问的这样的一个生产力。那第三个案例呢,是一个线上会议啊,数字营销内容制作的一个公司,那他的话呢,将我们小样本数字集成在自己的应用当中,那应用到了这个在线在线上会议场景当中的啊,多个方面,比方说他会用数字人进行演讲,同时呢,也会用数字人做这个串场的一个主持,它能够大大的去减少讲师的一个内容的制作周期,从而呢降降低了人工人工的这样的一个投入,也降低一个整个的一个生产的成本,而且可以快速的去进行这个创作内容迭代,让他们的这个。核心人员呢,关注于核心的这个。创作当中啊,不需要去啊,因为拍摄等等原因呢,去分散他们的精力。第四个呢,就是我们的MCN的这样的一个C端的用户。啊,这个是一个知名的经济学者,他的话呢,啊,采用数字人之后呢,可以把他原来的这个节目呢,调整为日更,而且呢,单期节目呢,浓缩至两到三分钟,那这样的话呢,他原本需要花费大量的时间在他自己的装造以及拍摄上面,但是用了数字人之后,他可每年可以节省差不多五到600小时的时间,而且在生成的这个环节当中,也不会去受到他出差的影响,更不用担心镜头不适感等等问题,那真正的帮他做到了一个大幅度提升这个生产效率的这样的一个核心痛点。
34:35
比如说这个案例呢,是我们的一个啊。头部的这样的一个ERP的这个管理软件的厂商,那他的话呢,其实是在自己的这个发布会上,利用了这样的一个啊数字人的形象去进行啊对应的这样的一个产品的介绍,那未来呢,其实也会在更多的场景下去使用到这个数字人。能更大程度上的去帮助他们自身啊,利用这样的一个数据去提升企业的整体形象。
35:05
那第六个呢,是医疗行业的这样的一个案例,因为之前也提到过,医生其实很多程很大程度上也会有这样的一个科普内容的一个诉求,那他们也希望能够把更多的啊有用的医疗知识传递给广大的群众,所以说他们其实也是希望能够通过这样的数字人的方案去帮助他们啊去。轻他们自身的在这个摄上的一些压力,也他们自己啊,可能没有办快速的获得这样的资源的这样的一个现状,所以能够利用数字呢,能够很好的帮助他们在随时随地,只要他们想就可以去生成对应的这样的一个啊科普视频,更好的帮助他们去做啊客户的服务,以及一些相关的知识的宣传。那第七个呢,是一个交互数字人案例,它是一个本地生活的一个服务商,他利用了数字来进行相应的一个带货,那这个方案呢,其实它是利用了我们的这个数字来批量的去进行了一批数资生产,作为他们平台的一个公用主播啊。
36:13
大幅度的去增强平台的直播平台的一个竞争力,这个时候呢,他其实用了这样的一个交互数字,可以帮他做到抢占闲实的一个流量,因为这些主播啊,完全不需要休息,负责人直播可以直播可以七乘24小时的在线,能够更好的去打造他们自身的这样的去打造他们自身商家的一个IP,增强他们的记忆点,而且因为我们现在的互啊。这个互动性的这个。交互型的数字人呢,其实也支持非常多种玩法,他可以在直播间进行问答互动,那如果出现了一些啊数字人无法进行回答的问题的时候呢,也可以采用真人接管的方式,那避免说啊这些问题啊被搁置或者是被遗忘啊,能够很好的去提升用户的这样的一个互动的一个体验感。
37:04
总体来说呢,这些啊,客户呢,利用型和交互型的这样的一个数字,人在自己的行业当中啊,得到了非常大程度上的效率的提升,能够更好的去发挥自己。强项所在,把更多的精力集中在自己。的核心竞争力的牺牲上,那不需要为一些拍摄啊等等的这样的一些繁琐的事项呢,去付出过多的精力。那以上呢是我的分享内容,感谢各位。谢谢黄老师的精彩分享,想和讲师交流问题的朋友请在问答区留言。接下来有请今天最后一位分享嘉宾,腾讯云原生产品中心云函数产品负责人何世友。何老师是c sig云原生产品中心函数产品组技术产品专家,前爱范儿CTO,国内首家小程序后端云知晓云负责人,TGO鲲鹏会广州理事会成员。欢迎何老师带来轻松上手AI作图腾讯云SERVERLESS3分钟快速部署搭建stable division的主题分享。
38:19
Hello,大家好,很高兴能够在今天和大家来分享。嗯,如何用腾讯的这种原生的技术来快速的去,呃,搭建一个AI做图的一个pass平台,它不同于说咱们去直接用这种API形式的SARS服务啊,就是我们这个基于生的这个容器以及函数的这个平台呢,可以去搭建。可以去搭建这种这个社区行的,像以及这个相关的这种社,其他的这种。啊这种啊这啊这种项目啊,可以快速的满足于这个不同的企业啊这个内部的这种呃权限呢啊这种的一个流程吧,局在一种fast这种固的一种方式,以及这种方式也可以广到比如咱们要去这种L模型也是样用的,今天呢,我们就快速来过一下整个流程。
39:21
呃,会去做一个演示啊,直观的给大家看如何快速的在几分钟里面可以搞定这一切,然后去把对内交付一个服务出去。那一开始呢,我们就讲一讲就是。今天的内容呢,分为两块,一个是我们的平台的介绍,就是原生这一套东西,到底它是一个什么东西,以及说它目前发展的怎么样子,如何用A这种场景中,第二部分呢,就是一个实操类的一个介绍了,就是我们会快速的大家演示一下,就是如何的快速创建,以及说创建完之后它是如何的应用在咱们自己的项目中啊有哪些呃,有别于其他的这种传统的这种部署架构的一些好处。
40:07
OK,第一部分呢,就是我们介绍一下云生到底它是一个什么东西。呃,首先可以这样来介绍一下,就是说整个云的形态啊,在过去的十几年里边呢,已经发生了三个阶段的一个变化了,第一个变化呢,就是我们呃,以K为代表吧,统一了云的这种生产的云的这种使用界面,就是现在你又呃control呢,其实用容器哈,基本上规范了标准的这种代码的这种交付,以及说云上部署和资源的这种调度运维的这样的一个基本的操作,基于Q呢,其实你可以在任何一朵云上去做所有的这一切的一个一个操作,所以这是原生的1.0时代,就是我们用容器生态和K8生态来统一了云的界面,那第二个阶段呢,其实就是以为代表,就是说它可以进一步的简化运维的工作。
41:00
可以让这个企业或者说研发团队啊,能够聚焦在啊这个业务代码上,就是你只管开发,开发完之后呢,你可以快速的发布部署到云上去,然后云的平台来帮你去完成,呃,这种运维自动化的相关的这种工作啊,你只管说搞定自己的业,自己的务快速增长就好了,至于说到底他要花多少钱,需要准备多少资源去撑起这个增长的流量,那就云的平台来做这个事儿,就这就是想要去解决的问题啊,那到了3.0的时代呢,其实就是以低代码以及现在的a agent技术为代表啊,就是它会更加理想一点,目前还没有到来,那么我们期望说接下来有由现在的上相对的AA,对吧,可以让大家看到了一次曙光,说接下来可能连开发的这个部分啊,都可以简化的比较彻底,我们就只关注于自己的业务逻辑了。就比如说我是个电商公司,我可能就关心我的供应链,我是一个直播公司,我可能就关注于我这个。直播的核心的这种价值啊,就更加进一步,那现在呢,其实我们是停留在的这个2.0的时代啊,我们把运维的工作交给云,我们专注的这个自己的这种业务的代码开发上啊,那S的这种产品啊,目前这个落地下来呢,主要的这个产品形态啊,就是fast函数,那函数呢,是腾讯云这个一八年推出来的这个的一个典型服务啊。
42:26
就是以function as service函数及服务的这样的一个典型的实现它的主要的一个产品形态,那就是开发者无需去管理虚拟机就可以直接执行他写的代码了。那这种形态呢,它是简化了,大幅度上简化了这种开发者的所需要去关心的东西,不需要去准备环境不需要去,甚至连镜像都可以不准备啊,你只要写你的代码就好了。然后写完代码交付到云上之后呢。它就可以从一个是付费形态上,它是可以按照啊,非常直接的这种按量付费的形态去啊,就是你实际上代码执行多长时间,他就算多少的时间的这种费用。
43:04
而不像说传统的部署里边,可能咱们也需要去准备服务器,对吧,开机的时刻就要去去去去承担这个成本了,它是不需要做这一些的,然后以及说你的这个流量上去之后呢,你的运维也是完全交给平台来解决的,你不需要去管理服务器的这种,加服务器减服务器也不需要去管理这种,呃,库存不需要去管理这种接入层呃,流量的这种l be等这些都不需要关心。平台就帮你去提供了一整套的这种全托管的弹性伸缩呀,以及并发的这种啊,Cos的等这些事儿啊,这就是函数作为一个S的典型的实现,它所提供的这种能力,那这种能力呢,也是深受开发者的喜爱啊,在过去的这个六七年的时间里边,光腾讯一家啊,就是我们已经服务了累计服务了200多万的开发者。那天及非撑我们也已经度过了,就说他在开发者的这种群体里边服务不同项目的这种孵化期,来到了一种行业的这种标准的啊,这种落地阶段了,所以我们也是一方面呢,是在这个国内外的这种评测中啊,Forest这种评测中呢,是取得了非常不错的一个成绩,同时呢,我们也是联合中国新能院去在国内啊,也是在二一年的时候推出了首首个这个fast标准认证啊,去统一了这种不同厂商,它在这种的这种产品的落地和这个实施。
44:36
过程中呢,能够去对企业或者用户吧,能够保持一个标准,就不需要,呃就就就尽尽可能的去让不同的这个客户在不同的云上去用这个产品的时候呢,能够有一个标准可以去兼容,不需要说我到了云上啊,我迁移的过程中会比较痛苦啊这些。那围绕着的这种整体的理想形态交付呢,呃,整个云也是,呃,围绕着它基础设施层到计算层,这到上层的生态和开发式工具呢,做了一系列的动作,这里我就不展开啊,就快速的跟大家说一下这种中间的计算层我们做了哪些事,我们除了函数这个标准的fast这个形态之外呢,我们也推出了像容器的。
45:18
就是你是容器,那大家都知道,可能容器还是偏运维的视角的,就是它还是相对来说运维的工作稍微多一点,那为了简化它的运工作呢,我们也是推出了T,就是你呃想就相当于是在使用一个虚拟的巨大的一个一个的一个一个集群,然后它里面只有一个节点,呃,通过这种方式来。呃,尽可能简化掉容器的一个运维的工作吧,然后再通过像我们的应用,呃这种工作的编排的服务,以及说这种时间总线bridge这种,呃呃不件平能够计算这一。呃,开发者尽可能的免掉这种服务的集成和运维的这个工作,精力都聚焦在这个业务开发上。
46:09
那这里快速给大家讲一下,就是呃函数它的一个运行机制到底是什么样子,为什么它可以实现它所呃宣称的它的这种呃价值,比如说它的名认为它的按量计费,那有别于传统的这种架构啊,就是咱们都知道,就是我们传统架构上呢,是写完代码之后,我要部署的时候呢,我肯定是要先准备好机器的是吧,我要找找一些机器啊,准备好放那里,然后去到这个机器上,把环境搭建好,把代码放上去,然后把这个进程装起来啊,然后再把这个装起来的这个健康的进程呢,再去加入到一个呃前面的LB是负载均衡接入层里面去,然后等待流量进来。啊,然后被分配到这个准备好的机器这样的进程里面去,啊,这是个传统架构,而函数呢,是反过来的。就是当你开发者写完代码之后啊,然后创建了一个函数之后呢,他其实是没有做一个真没有做一个实际的部署的,他只是说在一个呃,一个地域或者一个可用区里面去做了一个声明说,诶,我这个用户的这个函数的这个代码长什么样子,它的配置是什么,然后一切结束了,置触发条件,如AA了一个API的请求进来的时候,或者说我们配置的是一个卡卡的触发器,当有了一条新的卡卡的消息的时候,就真正的有请求进来的时候,他才会在。
47:38
这个当前的地域下去找到一台机器,然后在这个机器上把你的代码放上去,把它跑起来,然后去处理这个刚刚产生的这个请求,然后把这个结果返回回去。然后他再去毁掉自己,就是把这个资源再让出去,就是这样的一种动态的一个过程,所以大家可以看到它相对于传统的这种部署运维的架构呢,它是一个典型的反过来的就是一种响应式的,主动的这种调度的一个机制,正是基于此呢,它就可以实现什么呢?就是当你没有请求的时候。
48:11
就是你空闲的时候,他就真的不占用服务器资源,所以他就可以真正的意义上做到这种按量计费,同时呢,因为它是每一个请求他都会去找资源去部署,去响应的,所以它是可以做到一个非常完美的这种水平扩容。这就是他可以做到这种超高并发的这种能力支撑的一个原因。当然了,说到这儿可能大家会想到说,诶,那这样他们每一次请求是不是这个过程会做的比较的,这个比传统的这种部署架构,因为你已经跑起来了嘛,它是不是有一个这种启动延迟的这个问题的啊,那这个是不用担心的,就是这个技术的架构里面呢,其实我们做了大量的这个优化,就是通过一些热池子啊,或者其他的一种缓存费用的一些方式,能够让这个启动,我们称之为冷启动的时间可以降低的非常低。
49:03
那另外一个值得一说的就是在这种架构下呢,它是可以做到每一个请求级别的高可的服务保障,就是你每个请求进来,它都是在呃去。为这个求去找到一个可用区里面的一个可用资源,然后去快速的响应的,所以它是可以做到请求级别的高可用,这个像咱们传统架构里面对吧,我是先部署好一个服务器嘛,一旦这个服务器挂掉了,那那些请求原本已经录由过去的请求,它就其实就会被呃就被干扰,就这个请求会失败掉,那在函数的这个架构呢,是不会发生这种事情的。OK,所以基于这样的一种全全新的这种呃,运维和部署的架构啊,那在现在的AG的流行下,就是我们大模型的推理微调等等这样的一个呃,应用场景下呢,它其实就可以发挥更大的一个价值,我们看一下它的这个解决什么问题啊,首先我们看一下,其实就是现在的这种大模型推理微调啊,其实是非常繁荣,很多很多的这个公司就开始在。
50:02
这一块做一些探索,比如说我们会看到很多公司在做一些这种智能助理啊,导购啊,啊,或者是一些这种为设计师提供工作的这样的一个AI智能,对吧?去生成素材的,或者在游戏的这种开发里边,可以快速的去生成很多很多这种道具的啊,或者说角色的这种图这些。可以节省大量的这种人力,但同时呢,它也有挑战是吧,我就是我们也都知道,第一个挑战当然就是我们现在的资源成本,其实我们的GPU的卡是被这个限购的啊,就是这个目前体现出对我们这普通的这个用户来讲,就是又然后又少啊,基本上就是你真的想上业务的时候,一个成本超级高啊,第二个还不一定买得到啊,这是资源层面,算力层面的一个挑战,第二个呢,就是当我们真的买到卡了。然后这个时候我们来把这个服务跑上去,发现这个它相较于传统的这种API这种服务来讲哈,它会相对来说更重,因为每一次推理都是要占一张卡,我甚至几张卡。
51:06
然后呢,啊又会比较慢,对吧,可能要几秒才能够完成这个推理的过程,这个相对于传统的这种A外部服务API来讲是不一样的,传统能就是在几个几十毫秒的这种时间就可完成一个response一个应了,而在现在这个情况下,是个非常重计算的这样的一种运维场景,所以它的调模式已经发生了很大的改变,所以呃,传统的这种Webb的这种场景下的这种扩组和这种L的这这一套运维模式呢,其实已经不适用于这种呃,现在的这种重计算的推理的场景了。所以运维上会有很大挑战,第二个呢,就是传统的开发模式啊里有些挑战,就传统我们一个项目可能就是一个几百兆的一个镜像就搞定了啊,现在呢,你加上模型,加上那个推理的框架加一起,可能轻轻松松松就上十个G啊,非常大的一个容器镜像啊,那这个镜像呢,在部署环节,在它的啊上游环节,其实呃都都有很大的困难,所以它急需要一些新的架构,新的这种云上的这种资源的售卖方式来解决这些问题,能够把这个成本和它的这种呃,中间过程的一个一个代价能够降下去,能够加速这个呃。
52:21
呃,大家去上线这种创新的AA的这种应用的一个一个一个门槛吧。所以我们就推了几款产品啊,今天就着重给大家介绍一,其中一款就是我们的就是S的应用,那它直观想直观上来讲,给大家提供的就是一零技术门槛的,零用运维成本的一种类似于SARS级的这样的一个使用体验的一种应用,就是大家可以在空台上可以快速的去。呃,点两下就是完成一个创建,然后就有自己的这个的一个AI的一个应用,可以快速的去通过他给你的一个1L点进去就可以完成这个的一个使用了,就基本上你在这个过程里面,你不需要去关心说我有有没有卡。
53:09
以及说这个服务跑起来之后,我要应该怎么去啊,去给他啊,去管理里面的流量的分配啊,然后这个中间的调度,然后以及说中间的一些这个呃等等这些事都不需要你去关心的,你只需要关心的就是说我应该去用它来做什么,给什么人用啊,只关心这个就好了。另外呢,就是他在这过程过程里边产生的费用的这种结算方式呢,也是非常非常友好的,就是不同于说咱们刚刚前面提到,因为现在的GPU卡又少又贵是吧,那我们想要上业务,我们的先得提前去准备卡,提前去买到卡,然后再去啊把服务跑起来,那对于他来讲呢,就是只需要你去为实际生成图片,这个过程就是你占了CPU,呃,占了GPU多长时间去。呃,去去付这个钱就好了,至于说这个卡是怎么来供给的,呃呃,中间调度的过程是怎么着你的,不需要去关心,你只要关心的说我生成了几张图,一张图花了多长时间。
54:08
然后就为这个已经很可以了啊,那这个后其实就是平台做了很多的事情啊,我们去做了地域的这种调度,然后我去做了这种A。都在平台上去做了这样的一个调度啊,跨地域或者或者怎么着都可以,就是由平台来保障这一点,你不需要去关心说我的卡到底有没有起来啊,这样的一个底层的一个一个事儿。给那啊,我们提供了两种应用方式啊,对于一个企业来讲,首先我们提供了BBI的这个这个方式,那这个呢,就是通常来讲,可能是咱们用在啊内内部的这种设计师的这个团队的,对吧,你可能为每一个设计师去分配一个B,然后对于这他的需求来讲,可能就是说我希望每个设计师都有自己的单独的一套这个配置插件模型,因为每个设计师的工作流程也不一样嘛,以及说他有自己的图库是吧,他生成图自己去管理,不希望说他在生图的时候会跟其他的设计师产生什么冲突啊干扰之类的,所以我们的外部UI呢,是呃,提供了一个非常创新的叫多租户的一个体系啊,就是基本上咱们不需要去,不需要去关心,就是你开箱启用,然后你就可以为每个设计师,设计师去创建独属于他的一个表的一个应用,然后他们可以做到什么点呢?第一个就是说他们的这个租户模型是相互隔离的,就是每个设计师都有自己的这一套啊插件啊模型这套体系它自己独享,同时呢,底下的卡池是共享的,就是你还是只需要为实际上每一个设计。
55:40
支他用到的卡去付费啊,至于说这个卡的供给呢,就是由由平台来保障啊,所以就完全的实现了,就成本上可以极大的节约,同时呢,在这个交付层面的设计师又呃可以使用到独享于他自己的这种web的服务,能够帮助他的工作。另外一个应用的方式呢,是我们的API呢,是呃,帮助咱们去集成到自己的一些开发里面,比如说啊,我们推对C端去推一个,呃,这种纹身图的一个应用,对吧,比如说像前日子比较流行的是妙压相机呀,然后以及像美图秀秀等等这样的一个服务,是吧,那你就需要一个后边的一个啊随随的这样的个的A的应用,能够帮助你去在你的APP里去这样的能力,那呢,我们是为他去做了两方面的一个一个东西,第一个就是说同步的这种API请求是吧,那它呢就是啊,就是你创建出来它就有一个多项的一个API服务了,同时呢,如果说你的量很大,那其实你就没法去啊。
56:38
就是说有很多很多卡去撑嘛,可能就需要去把它同步转异步去在一个队列里面去排队,那我们也是推了这样的一个呃,在线转转进线的这样的一种支持啊,就是你的呃纹身图的端上的请求发过来之后呢,我们会帮你在平台层去做一个队列的缓存,去慢慢的排队,去在有限的卡池里面去完成这样的一个呃生图的这种任务的,呃一个一个执行,这个也是不需要咱们去操心的,就平台来完全的cover掉整个过程。
57:07
OK啊,那他就可以基于这一套东西呢,就可以帮助咱们完成这个呃ST的整套的这种应用流水线,你可以在这个呃过程里边呢,完成自己的微调,完成自己的这种推理,以及和自己的这种呃流程去做一个打通和集成,完成自己在这个类目里边想要完成的这种创新的应用的一个上线。啊,然后我就给大家快速的介绍一下。呃,一个一个演示吧,就是怎么去快速的去去。去在线上去完成这个部署啊,我这个时间不多,因为我约的会议室的时间到了,不好意思,非常不然后可以看到在这个应用的平台上呢,我们可以看到有一个应用市场,然后在这里呢,有个一个应用。嗯。啊,这个界面大家看起来是正常的。然后我们点下一步。就看到在这里面大家只需要去选呃,去填自己的应用版,然后选择己的卡型,选择一个地域啊,然后在这边选择自己的一个YB的一个呃东西就好了,然后在这边呢,它会提示你会用到哪些资源啊去去做这个事,然后我们只需要去点击完成就好了,因为时间的关系啊,我就快速的把这个过程大概是一个两分钟左右的一个样子,它就会完成一个创建。
58:22
然后创建完之后呢,就就给你一个这里我准备好了一个提前认接好的,然后它就给你一个这样的一个详情页,可以看到它依赖了AP网关日志和CS文件系统去做这种中间的服务的支撑,然后我们这边快速访问一个。像这里呢,它就会给你一个呃,YB的一个入口啊,我们稍微等待一下,它是一个就是刚刚说的那个过程,就是他没有预留资源的,它会在你访问的这个过程里,呃,访问的这个时候呢,就会去给你找机器,去把卡准备好,把服务跑上去,然后去给你响应。
59:05
我省的大概是十秒多一点的样子,是一个冷起,但是我们会做一些这个,呃。一个一个缓存呢,以及优化的一些措施啊,就是当你第一次访问之后呢,后续的一些连续的请求是会马上去响应。可以看到啊,就是我们啊快速就就可已经加载出来了,就得到一个,如果大家玩过Y的话,应该可以知道,这是一个全功能的一个界面,它就是完全兼容社区的一个版本,然后在这里我们可以快速的演示一下。我们点生成。
60:03
可以看到,就我们已经拿到了这个生的结果是吧,就整个过程是非常快的,就是你可以不用去提前准备很多很西,马上就可拿到自己的,那对于API。可以快速的去去,呃,提供这样的API的服务,你快速去调用这个API,就可以完成自己的这个APP的集成了。好,以上呢,就是呃,这一次的一个分享的一个全部内容,谢谢大家。好的,感谢何老师的精彩分享,现在我们进入到QA环节,请三位老师为我们解答观众的提问。麻烦三位老师打开摄像头。嗯,看到后台有同学问张老师啊,分成的内容可以用于商业吗?呃,关于商业化这块就是,呃,一般其实还是要看这个产品的那个具体的协议,呃,但至少在腾讯云的aigg的这些产品里面,呃,大部分都是可以支持去商用的,是没有问题的,嗯,OK,好,下一个问题,腾讯的AI什么时候可以比肩mid?
61:08
呃,其实至少在至少在今年上半年吧,就是在整个行业里面是非常领先的,就是呃,你也不用去做太多的一些promote调试,呃,然后呃也可以生成很精美的这样一些图片,但其实在最近半年吧,呃,其实整个行业里面的其他的各种纹身图的产品都是在快速的进步,快速追赶,至少在目前这个阶段,我觉得如果你说mid journey还是最领先的,可能很多人会存疑。那我们腾讯的呃,文生度的产品,包括像AI绘画,还有那个呃,那个那个混圆大模型的呃,稳生图的模型啊,其实也是,呃最近半年也带来很多有快速的进步,我建议也是可以去尝试一下,我就觉得在一些场景下面,呃,还是可以跟major去PK的,嗯,有同学问啊,AIGC生成的内容如何解决版权的问题呢?
62:04
嗯,关于版权这个问题可能就比较复杂啊,呃从几个方面说吧,那第一个方面就是在呃AI的训练方面,那这个是最复杂的,可能最核心的可能就是训练的数据这一块的一个版权问题,那如果不涉及到训练的话,那就是在AI的这样一些生成,我觉得首先就是要注意,就是呃在生成的时候的一些输入,就是是呃是没有版权的问题的,那你如果拿一个有别人有版权的图片去生成一张呃新的图片,那这个肯定是有风险的。那还有一个问题,可能就是在ADC生成的图片的版权方面这一块,呃,我所知就是还没有特别完善的一些,呃行业里面的立法可能还是要再看,就是呃未来这块的,呃,对这块版权的一个,呃立法和规范啊,会怎么发展?了解,嗯,那最后一个问题,腾讯的AIGC在微课制作方面有哪些典型的案例?
63:06
呃,我觉得在微课应该也算属于是线上的在线教育的这一块嘛,呃,其实最我觉得最典型的案例应该就是数字人了,呃,其实我们玉前老师刚刚也介绍了很多数字的场景,包括在医疗,呃,其实也是有这种在线的医疗教育的,呃,一些场景其实已经挺成熟了。好的,谢谢张老师,嗯,下面有同学提问黄老师哈,腾讯云有提供整合好的产品,可以让用户快速的构建数字人吗?啊,可以的,呃,其实我们的用户可以登录到腾讯云的官网,然后在里面输入腾讯云啊智能数字人,那就可以搜索到我们对应的这样的一个产品,那可以进入到产品当中去做对应的这样的一个体验,这是没问题的。嗯。好的,下一个问题,嗯,一小时的数字身分分身有API可以调用的吗?
64:03
呃,我们的话会提供对应的这样的一个形象定制的一个API也是一样的,在我们的数据的相关的,呃,产品文档当中,嗯,各位观众和各位这个用户可以去体验一下,对,可以去调用对应的这样的一个API,嗯,好,有同学在问,请问数字人训练用到算力设备有哪些?呃,这样子,我们的算力设备的话呢,目前来说啊,都是采用腾讯上这样的一些服务,对于用户来说呢,其实是不需要单独。嗯,好的,感谢黄老师。嗯,下一个问题有同学在问,嗯,请问腾讯云开箱即用SD的服务有什么优惠?
65:03
有什么用户的优惠啊,请问何老师。啊。嗯,优惠嘛,嗯,他的优惠当然就是说对于每一个新用户来讲,就是你可以在这边呢,可以快速的去体验,呃,就是SD的这样的一个能力吧,这个过程里边其实你是不需要去一些买卡或怎么着的,就是你会快速创建完,然后去访问它,去使用它就好了,然后它是按照你实际的占用GPU的这个时间去算你的钱的啊,所以整体上比你。啊,不管是在本机部署,还是去在找一些这个可以买到卡的这个平台上去把卡准备好的话,整个过程还是要省省省不少钱,也就省不少时间的,但是在如果说剩下都不需要去写银行代码,你就可以把这个跑起来啊,就整个过程还是比较贴心吧。好的,下一个问题,请问腾讯云serverless产品是怎么定价的?有免费体验的服务吗?
66:04
呃呃,这个是有的,首先呢,它的定价呢,是按照呃以这个SD来说吧,SD的话,其实呃你呃会感觉到的一个配置就是啊,你大概是一个16GB显存和32GB内存的这样的一种一个函数的规格,然后它的计费呢,就是按照这个规格乘以时间,就是以啊毫秒为级别的一个时间,再乘以一个单价。呃。这个就是以这样的一个方式来来算这个费用啊,就是毫秒级别的一个一个时间的一个按量计费,然后呢,对于新用户来讲呢,每个新用户啊,就是你如果是一个刚刚注册的一个用户呢,我们有三个月的这样一个免费的额度供给,大概这个可以帮助你在这个三个月里面,基本上可以不用花什么钱呢,就完成你的开发和上线啊嗯。好的,有同学在问,Serve应用的场景在哪些领域是最适合的?呃,首先它其实和呃容器啊都是类似的,就是它在全场景都还比较适合,比如说我们和云开发一起合作,去针对这个小程序的这个场景啊,也是服务了非常非常多的小程序的上线的,这是个典型的在线场景,那在进离线场景呢,我们会认为它的竞争力会更多一点,就是在一些数据处理场景啊,然后在一些比如说数据处理,数据清洗,然后以及一些中极的,比如说音视频的转码啊啊,以及像现在的这个AI的推理啊。
67:29
等等这些吧,啊,会优势更大一点啊,因为它的调度层其实相会会更加的,就相当于他已经提前做好了这个架构的一个支撑就是嗯。好,下一个问题,Serverless需要编写代码吗?如何使用?Serverless能本地部署吗?呃。可以理解为S呢,是一种全新,是一种新的这种云上的开发的方式,所以呃呃,我们首先也准备了很多很多模板,以及像刚刚说的这个,呃,刚刚提到的就是吧,它其实是一个模板化的东西,你可以点两个可以以接玩了,那它是不需要写代码的啊,同时呢,它是一个新的这种开发平台嘛,它是支持你写任何你想要写的代码,然后把它快速的上线发布的啊,然后呃,最后一个问题,啥是本地能够部署是吧,这个地部署它是一个。
68:23
对,它是一个算力平台,所以它啊不是一种开发框架啊,可以这样来理解它吧,就是它是一个云上的一种开发发布和上线的一个平台,它帮你解决了服务上线的一个这个这个过程,所以你的开发呢,是可以在本地开发啊,你可以交付成一个标准的镜像,它也是兼容的。操。好,最后一个问题,请问AI服务也能做到低延时吗?啊,这个当然是可以的啊,就是我们刚刚演示了呢,是一个他从零从零到一的去帮你去准备卡,然后跑服务去跑起来是吧,它大概有一个十秒左右的一个延迟,就是从零开始去启动起来的,但如果你的应用对这个延迟有要求,比如说你要马上响应,马上去供给的话呢,我们是有这种预制并发的这样的一个配置的,就是底层逻辑,就是他会帮你去准备好卡,像一个传统服务一样的跑起来,去随时随地的响应这个请求,那这个呢,它的延迟就是跟传统的这种在线服务是一样的,就是没有一个东西的延迟啊,可保证这个体验的。
69:29
好的,本次的问答环节到此结束,感谢三位老师带来的精彩回答和分享,本期活动也进入到了尾声,再次感谢大家的参与,关注我们,下期活动再见。
我来说两句