Python 中如何在内存中优雅地提取视频帧？

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

This topic created in 722 days ago, the information mentioned may be changed or developed.

通过网络传输过来的视频，如何在不保存为文件的情况下，用工具提取视频帧呢？

一开始以为很容易，但是找了很久发现 Opencv 和 ffmpeg 都没有直接从内存中提取的方法，都需要通过一个临时文件才能提取。而目目前需求上需要优化处理视频的时间，所以想着修改这个步骤。

内存

视频帧

提取

32 replies • 2024-08-08 08:51:26 +08:00

Doraismydora

Aug 2, 2024

·sws_sacle· 把 ·AVFrame· 转成 rgb32 ，然后弄一个 ·cv::Mat· 复制过去

qsnow6

Aug 2, 2024

用虚拟文件交换就行了

Latin

Aug 2, 2024

网络传输中原先的格式是什么链路

Haku

Aug 2, 2024

@Latin 以 HTTP 的方式将整段视频以二进制字节流完整的传输过来。

SenseHu

Aug 2, 2024

场景没描述清, 提取之后是被谁消费, 落盘？其他程序用？其他程序是什么框架

Haku

Aug 2, 2024

@SenseHu 提取之后会由 AI 进行处理，所以还会被转换成对应的图片格式保存在内存中。整个过程都在 Python 上处理。

Huelse

Aug 2, 2024

直接用内存映射不就行了，然后就是正常的 IO 操作

somebody1

Aug 2, 2024

你能访问视频程序的内存内容，那别的程序不一样能访问，那你的内存不就成了透明的嘛！

这最基础的访问限制都闹不明白吗！！！

sweelia

Aug 2, 2024

@Haku 可以参考 https://github.com/FFmpeg/FFmpeg/blob/master/doc/examples/avio_read_callback.c ，主要是 read_packet 函数，buffer 的装载逻辑（ av_file_map ）换成你自己的，可以流式加载，不用一次性读完。如果对 c 不熟悉，可以找个 python binding 来使用。decode 之后拿到 AVFrame ，随便玩

Haku

Aug 2, 2024

@somebody1 啥？我觉得你可能没理解，我这里指我的服务器收到了视频文件，然后我不希望把他写入到硬盘中，而是直接将传输过来的文件进行视频帧提取。

stebest

Aug 2, 2024

额，这个倒是跟视频没啥关系，不就是想用 bytesIO 嘛。

somebody1

Aug 2, 2024

@Haku #10
那就是 11 楼的答案了

mightybruce

Aug 2, 2024

看起来你对 opencv 和 ffmpeg 都不熟悉，先说说你传来的视频流是什么协议吧

stebest

Aug 2, 2024

@stebest 挺简单的，给个示例吧 import numpy as np
import cv2 as cv
import io

image_stream = io.BytesIO()
image_stream.write(connection.read(image_len))
image_stream.seek(0)
file_bytes = np.asarray(bytearray(image_stream.read()), dtype=np.uint8)
img = cv.imdecode(file_bytes, cv.IMREAD_COLOR)

mightybruce

Aug 2, 2024

直接读完整的视频就是 bytesIO 二进制流了，转换一下变成 numpy array 就行

Haku

Aug 2, 2024

@stebest 好的谢谢，我试试。

Haku

Aug 2, 2024

@stebest @mightybruce
谢谢两位，可能是我一开始哪里搞错了，我用 cv2 和 ffmpeg 去进行提取时，都报错了，网上查询也没找到一个很好的方法。

NessajCN

Aug 2, 2024

Python 这语言本来就不适用于直接对内存进行操作
建议换 C 或 Rust
https://ffmpeg.org/doxygen/6.1/group__lavc__decoding.html#ga11e6542c4e66d3028668788a1a74217c
你可能想要这个方法

cooljiang

Aug 2, 2024

@stebest 确实这个是正解，创建一个 io 字节流。

Anarchy

Aug 2, 2024

用 pyav 很简单的

Anarchy

Aug 2, 2024

@Anarchy 给个例子:
with av.open(url, options=options) as container:
video = container.streams.video[0]
for i,t in enumerate([10,15,20,25,30]):
container.seek(int(t/video.time_base)+video.start_time, backward=True, stream=video)
frame = next(container.decode(video))
frame.to_image().save(target_folder/f'frame{i}.png')

Haku

Aug 2, 2024

@stebest
请问下，cv2 读取视频我只找到了 VideoCapture ，但是 VideoCapture 却只能读文件了。
还是说能用读图片的方式，用 imdecode 等从视频二进制流里面直接读取到图片吗？

Haku

Aug 2, 2024

@Anarchy pyav 我知道，不过我这里环境特殊，装不上这个包所以暂时没考虑。

sweelia

Aug 2, 2024

@Haku https://github.com/opencv/opencv/pull/25584 不知多久才能合入主线，有条件还是建议走 ffmpeg 的路子，控制更精细，遇到问题也有解决方案。按经验，有些推流器封装不太标准，需要野路子 hack 兼容。

stebest

Aug 2, 2024

@Haku 如果只是希望在内存中方便读取，使用 tmpfile import tempfile
import cv2

my_video_bytes = download_video_in_memory()

with tempfile.NamedTemporaryFile() as temp:
temp.write(my_video_bytes)

video_stream = cv2.VideoCapture(temp.name)

# do your stuff.

stebest

Aug 2, 2024

不过实际上还是会在本地创建文件，video capture 本身不支持直接从 memory 中读取，如果是自己控制数据流，用一个迭代器或者生成器把每一帧转 cv mat 就可以

stebest

Aug 2, 2024

如果还是希望用 opencv video capture 处理，1.可以将视频流使用虚拟摄像头输出，用 opencv 打开即可。
2.使用流媒体协议，opencv video capture 应该也直接支持。
3.使用 videogear 的 netgear ，一个比较简单的例子，具体可以去看文档
server end

```
# import required libraries
from vidgear.gears import VideoGear
from vidgear.gears import NetGear

# open any valid video stream(for e.g `test.mp4` file)
stream = VideoGear(source="test.mp4").start()

# Define Netgear Server with default parameters
server = NetGear()

# loop over until KeyBoard Interrupted
while True:

try:

# read frames from stream
frame = stream.read()

# check for frame if Nonetype
if frame is None:
break

# {do something with the frame here}

# send frame to server
server.send(frame)

except KeyboardInterrupt:
break

# safely close video stream
stream.stop()

# safely close server
server.close()
```

client end

```
# import required libraries
from vidgear.gears import NetGear
import cv2

# define Netgear Client with `receive_mode = True` and default parameter
client = NetGear(receive_mode=True)

# loop over
while True:

# receive frames from network
frame = client.recv()

# check for received frame if Nonetype
if frame is None:
break

# {do something with the frame here}

# Show output window
cv2.imshow("Output Frame", frame)

# check for 'q' key if pressed
key = cv2.waitKey(1) & 0xFF
if key == ord("q"):
break

# close output window
cv2.destroyAllWindows()

# safely close client
client.close()
```

vituralfuture

Aug 2, 2024 via Android

楼上 bytesio 是一个方法，直接放到 tmpfs 里也行，tmpfs 的 backend 就是内存

ClericPy

Aug 2, 2024

tmpfs 比较简单，也就是常见的 /dev/shm

SP00F

Aug 2, 2024

走内存，在并发大文件的情况下。。怎么解决内存占用的问题……

走内存例如 golang 中的 gin 上传文件一样，在读取文件都是 io ，调用 ffmpeg 或者 openvc 读取文件最后不都是 io 吗（个人拙见）😳

longredzzz

Aug 2, 2024

https://github.com/chenxinfeng4/ffmpegcv/blob/0e934647e99ee03c478558c82c48dd4add113136/ffmpegcv/ffmpeg_reader_stream.py

可以参考该代码

Lihanx9

Aug 8, 2024

感觉没有那么复杂吧...

VideoCapture 本身支持使用 HTTP 协议的地址作为视频文件路径，如果没有特殊的请求限制，直接让 VideoCapture 自己处理流，然后直接遍历帧、或者设置 cv2.CAP_PROP_POS_FRAMES 或者 cv2.CAP_PROP_POS_MSEC 读指定帧都是可以的。不知道这种方式是不是符合需求。