首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#视频

文本美学:text-image打造视觉吸引力

修己xj

当我最近浏览 GitHub 时,偶然发现了一个项目,它能够将文字、图片和视频转化为文本,我觉得非常有趣。于是我就花了一些时间了解了一下,发现它的使用也非常简单方...

1200

程序员喜欢的几款神器

用户10992031

如果是视频类的自媒体玩家,那么视频素材显得格外重要,我们一般会想要下载网络上的视频素材,进行加工和发布,市面上已有的且比较好用的,基本上是需要付费了。

1500

国外大学生都用FPGA做什么项目(十五)

碎碎思

项目很多,从2006~2023年,应该有一部分项目没有展现出来,大部分都有视频介绍,但是我看了一些视频,都是简单演示一下功能,并没有设计思路,所以需要自行查看源...

2800

核心指标超越GPT-4 Turbo!商汤多模态大模型「开箱」

AI掘金志

现场播放的三段视频完全由大模型生成,效果逼真视频,其实文生视频中的人物、动作和场景的可控性非常难把握,但商汤文生视频平台依然保持视频内容的连贯性和一致性。

5600

【FFmpeg】视频与图片互相转换 ( 视频与 JPG 静态图片互相转换 | 视频与 GIF 动态图片互相转换 )

韩曙亮

命令 , 将上一个章节生成的 30 张图像 生成一个新的视频 , 设置 帧率为 15FPS , 说明会生成一个 2 秒的视频 ;

2100

2.3K Star.极客玩法!使用蓝牙设备解锁你的Mac电脑

开源日记

| 2.1K Star找了很久!Python PDF转DOCX好用工具24.8K Star炫酷好用!!!跨平台系统监控工具5.5K Star真不错!简化数据收集...

7810

Open-Sora全面开源升级:支持16s视频生成和720p分辨率

机器之心

作者团队表示,基于Transformer的特性,可以轻松扩展 DiT 架构以支持图像到图像以及视频到视频的任务。他们提出了一种掩码策略来支持图像和视频的条件化处...

4010

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

机器之心

过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety System...

3810

CVPR 2024 | 跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式

机器之心

在日常活动中,人的运动经常引起衣服的附属运动 (secondary motion of clothes) 并因此产生不同的衣服褶皱,而这需要对人体及衣服的几何、...

4610

颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑

新智元

这是一款重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个...

16510

Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率

AI科技评论

作者团队表示,基于Transformer的特性,可以轻松扩展 DiT 架构以支持图像到图像以及视频到视频的任务。他们提出了一种掩码策略来支持图像和视频的条件化处...

9710

【工具资源】药物研发平台;物理符号优化平台;手术视频可视化解答

HyperAI超神经

在 AI for Science 的规模化推广过程中,低门槛使用且开源的高性能工具至关重要。一方面,科研人员能够通过上手使用,更加直观地了解 AI 的能力;另一...

6910

在线教程丨刘强东数字人首秀交易额破5千万!用GeneFace++ 生成实时说话数字人

HyperAI超神经

近日,京东创始人刘强东化身「采销东哥 AI 数字人」,在京东家电家居和超市的采销直播间开启了自己的直播首秀。此次直播活动观看人次超 2 千万,交易总额超 5 千...

7310

如何使用Metropolis微服务为NVIDIA Jetson构建AI网络视频录像机

GPUS Lady

苏州吉浦迅科技有限公司 · 联合创始人 (已认证)

此外,利用Metropolis微服务在NVIDIA Jetson上运行的生成式AI模型,可以更轻松地深入洞察和分析视频流,实现动态和交互式应用。这种能力使得Me...

7810

CVPR2024-扩散模型可解释性新探索,图像生成一致性创新高!AI视频生成新机遇?

BBuf

在本研究中,作者指出了对图像生成扩散模型的可重复性或一致性进行定量评分的重要性。本文提出了一种基于成对平均CLIP(对比语言-图像预训练)分数的语义一致性评分方...

9210

IEEE Transactions on Multimedia | 实时自由视角视频生成系统

用户1324186

上海交通大学 · 研究员 (已认证)

随着5G网络和边缘计算技术的普及,实时自由视角视频合成方法在自由视角视频直播、3D电视、快速自由视角视频渲染以及许多其他场景中的应用越来越广泛。一般来说,实时自...

8010

ICCV 2023 | Imitator:个性化语音驱动的 3D 人脸动画

用户1324186

上海交通大学 · 研究员 (已认证)

图 1:Imitator 是一种用于个性化语音驱动 3D 人脸动画的新方法。给定音频序列和个性化风格嵌入作为输入,我们生成特定人物的运动序列,并为双唇辅音('m...

11710

RTC @scale 2024 | 如何提升国际通话质量

用户1324186

上海交通大学 · 研究员 (已认证)

通话中继器位于中间,充当通话参与者之间的代理。在一对一的音频通话中,每个参与者发送一个流并接收一个流;而在视频通话中,由于音频和视频被编码为不同的流,相同的参与...

8110

Power BI 矩阵多指标总分解决方案

wujunmin

如果在矩阵中展示一个指标,比如下方的日周业绩,默认的显示效果没有什么值得诟病的地方。

8310

dotnet tool:你可能未曾意识到它的强大

DevOps持续交付

在.NET的世界里,dotnet 命令是一个极其强大的工具,它不仅仅用于构建、运行和发布应用程序,还提供了广泛的内置功能,帮助开发者高效地完成各种任务。然而,你...

4810
领券
http://www.vxiaotou.com