rdtest/utils.py at master · chemag/rdtest · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
#!/usr/bin/env python3

"""utils.py module description."""

import json
import numpy as np
import os
import re
import subprocess
import sys
import tempfile
import time

PERCENTILE_LIST = (0, 5, 10, 25, 75, 90, 95, 100)

VMAF_MODEL = "/usr/share/model/vmaf_4k_v0.6.1.json"
VMAF_MODEL = "/usr/share/model/vmaf_v0.6.1.json"
VMAF_MODEL = "/usr/share/model/vmaf_v0.6.1neg.json"


# https://gitlab.com/AOMediaCodec/avm/-/blob/main/tools/convexhull_framework/src/Utils.py#L426
def parse_perf_stats(perfstats_filename):
    enc_time = 0
    enc_instr = 0
    enc_cycles = 0
    flog = open(perfstats_filename, "r")
    for line in flog:
        m = re.search(r"(\S+)\s+instructions", line)
        if m:
            enc_instr = int(m.group(1).replace(",", ""))
        m = re.search(r"(\S+)\s+cycles:u", line)
        if m:
            enc_cycles = int(m.group(1).replace(",", ""))
        m = re.search(r"(\S+)\s+seconds\s+user", line)
        if m:
            enc_time = float(m.group(1))
    perf_stats = {
        "time_perf": enc_time,
        "instr": enc_instr,
        "cycles": enc_cycles,
    }
    return perf_stats


def run(command, **kwargs):
    debug = kwargs.get("debug", 0)
    dry_run = kwargs.get("dry_run", False)
    env = kwargs.get("env", None)
    stdin = subprocess.PIPE if kwargs.get("stdin", False) else None
    bufsize = kwargs.get("bufsize", 0)
    universal_newlines = kwargs.get("universal_newlines", False)
    default_close_fds = True if sys.platform == "linux2" else False
    close_fds = kwargs.get("close_fds", default_close_fds)
    shell = kwargs.get("shell", True)
    logfd = kwargs.get("logfd", sys.stdout)
    get_perf_stats = kwargs.get("get_perf_stats", False)
    gnu_time = kwargs.get("gnu_time", False)
    if type(command) is list:
        command = subprocess.list2cmdline(command)
    if debug > 0:
        print(f"$ {command}", file=logfd)
    if dry_run:
        return 0, b"stdout", b"stderr"
    if get_perf_stats:
        _, perfstats_filename = tempfile.mkstemp(dir=tempfile.gettempdir())
        command = f"3>{perfstats_filename} perf stat --log-fd 3 {command}"
    elif gnu_time:
        command = f"/usr/bin/time -v {command}"

    ts1 = time.time()
    p = subprocess.Popen(  # noqa: E501
        command,
        stdin=stdin,
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE,
        bufsize=bufsize,
        universal_newlines=universal_newlines,
        env=env,
        close_fds=close_fds,
        shell=shell,
    )
    # wait for the command to terminate
    if stdin is not None:
        out, err = p.communicate(stdin)
    else:
        out, err = p.communicate()
    returncode = p.returncode
    ts2 = time.time()
    # get performance statistics
    other = {
        "timediff": ts2 - ts1,
    }
    if get_perf_stats:
        perf_stats = parse_perf_stats(perfstats_filename)
        other.update(perf_stats)
    elif gnu_time:
        # make sure the stats are there
        GNU_TIME_BYTES = b"\n\tUser time"
        assert GNU_TIME_BYTES in err, "error: cannot find GNU time info in stderr"
        gnu_time_str = err[err.index(GNU_TIME_BYTES) :].decode("ascii")
        gnu_time_stats = gnu_time_parse(gnu_time_str, logfd, debug)
        other.update(gnu_time_stats)
        err = err[0 : err.index(GNU_TIME_BYTES) :]
    stats = {f"perf_{k}": v for k, v in other.items()}
    # clean up
    del p
    # return results
    return returncode, out, err, stats


GNU_TIME_DEFAULT_KEY_DICT = {
    "Command being timed": "command",
    "User time (seconds)": "usertime",
    "System time (seconds)": "systemtime",
    "Percent of CPU this job got": "cpu",
    "Elapsed (wall clock) time (h:mm:ss or m:ss)": "elapsed",
    "Average shared text size (kbytes)": "avgtext",
    "Average unshared data size (kbytes)": "avgdata",
    "Average stack size (kbytes)": "avgstack",
    "Average total size (kbytes)": "avgtotal",
    "Maximum resident set size (kbytes)": "maxrss",
    "Average resident set size (kbytes)": "avgrss",
    "Major (requiring I/O) page faults": "major_pagefaults",
    "Minor (reclaiming a frame) page faults": "minor_pagefaults",
    "Voluntary context switches": "voluntaryswitches",
    "Involuntary context switches": "involuntaryswitches",
    "Swaps": "swaps",
    "File system inputs": "fileinputs",
    "File system outputs": "fileoutputs",
    "Socket messages sent": "socketsend",
    "Socket messages received": "socketrecv",
    "Signals delivered": "signals",
    "Page size (bytes)": "page_size",
    "Exit status": "status",
}


def gnu_time_parse(gnu_time_str, logfd, debug):
    gnu_time_stats = {}
    for line in gnu_time_str.split("\n"):
        if not line:
            # empty line
            continue
        # check if we know the line
        line = line.strip()
        for key, val in GNU_TIME_DEFAULT_KEY_DICT.items():
            if line.startswith(key):
                break
        else:
            # unknown key
            print(f"warn: unknown gnutime line: {line}", file=logfd)
            continue
        gnu_time_stats[val] = line[len(key) + 1 :].strip()
    gnu_time_stats["usersystemtime"] = str(
        float(gnu_time_stats["usertime"]) + float(gnu_time_stats["systemtime"])
    )
    return gnu_time_stats


def ffprobe_run(stream_info, infile, logfd, debug=0):
    cmd = ["ffprobe", "-v", "0", "-of", "csv=s=x:p=0", "-select_streams", "v:0"]
    cmd += ["-show_entries", stream_info]
    cmd += [
        infile,
    ]
    retcode, stdout, stderr, _ = run(cmd, logfd=logfd, debug=debug)
    assert retcode == 0, f"error running {cmd}\nout: {stdout}\nerr: {stderr}"
    return stdout.decode("ascii").strip()


def ffmpeg_run(params, logfd, debug=0):
    cmd = [
        "ffmpeg",
        "-hide_banner",
    ] + params
    return run(cmd, logfd=logfd, debug=debug)


def get_resolution(infile, logfd, debug=0):
    return ffprobe_run("stream=width,height", infile, logfd, debug)


def get_pix_fmt(infile, logfd, debug=0):
    return ffprobe_run("stream=pix_fmt", infile, logfd, debug)


def get_framerate(infile, logfd, debug=0):
    return ffprobe_run("stream=r_frame_rate", infile, logfd, debug)


def get_duration(infile, logfd, debug=0):
    # "stream=duration" fails on webm files
    return ffprobe_run("format=duration", infile, logfd, debug)


# returns bitrate in kbps
def get_bitrate(infile, logfd, debug):
    size_bytes = os.stat(infile).st_size
    in_duration_secs = get_duration(infile, logfd, debug)
    actual_bitrate = 8.0 * size_bytes / float(in_duration_secs)
    return actual_bitrate


def get_psnr(distorted_filename, ref_filename, psnr_log, logfd, debug):
    psnr_log = (
        psnr_log
        if psnr_log is not None
        else tempfile.NamedTemporaryFile(prefix="psnr.", suffix=".log").name
    )
    ffmpeg_params = [
        "-i",
        distorted_filename,
        "-i",
        ref_filename,
        "-filter_complex",
        f"psnr=stats_file={psnr_log}",
        "-f",
        "null",
        "-",
    ]
    retcode, stdout, stderr, _ = ffmpeg_run(ffmpeg_params, logfd=logfd, debug=debug)
    return parse_psnr_log(psnr_log)


def parse_psnr_log(psnr_log):
    """Parse log/output files and return quality score"""
    with open(psnr_log) as fd:
        data = fd.read()
    # n:1 mse_avg:2.59 mse_y:3.23 mse_u:1.61 mse_v:1.03 psnr_avg:44.00 psnr_y:43.04 psnr_u:46.07 psnr_v:48.02
    # n:2 mse_avg:3.77 mse_y:4.87 mse_u:1.96 mse_v:1.20 psnr_avg:42.36 psnr_y:41.25 psnr_u:45.22 psnr_v:47.35
    psnr_values = []
    for line in data.splitlines():
        # break line in k:v strings
        line_items = list(item for item in line.split(" ") if ":" in item)
        psnr_values.append(
            {item.split(":")[0]: item.split(":")[1] for item in line_items}
        )
    psnr_y_list = np.array(list(float(item["psnr_y"]) for item in psnr_values))
    psnr_u_list = np.array(list(float(item["psnr_u"]) for item in psnr_values))
    psnr_v_list = np.array(list(float(item["psnr_v"]) for item in psnr_values))
    psnr_dict = {
        "y_mean": psnr_y_list.mean(),
        "u_mean": psnr_u_list.mean(),
        "v_mean": psnr_v_list.mean(),
    }
    # add some percentiles
    psnr_dict.update(
        {
            f"y_p{percentile}": np.percentile(psnr_y_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    psnr_dict.update(
        {
            f"u_p{percentile}": np.percentile(psnr_u_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    psnr_dict.update(
        {
            f"v_p{percentile}": np.percentile(psnr_v_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    return {f"psnr_{k}": v for k, v in psnr_dict.items()}


def get_ssim(distorted_filename, ref_filename, ssim_log, logfd, debug):
    ssim_log = (
        ssim_log
        if ssim_log is not None
        else tempfile.NamedTemporaryFile(prefix="ssim.", suffix=".log").name
    )
    ffmpeg_params = [
        "-i",
        distorted_filename,
        "-i",
        ref_filename,
        "-filter_complex",
        f"ssim=stats_file={ssim_log}",
        "-f",
        "null",
        "-",
    ]
    retcode, stdout, stderr, _ = ffmpeg_run(ffmpeg_params, logfd=logfd, debug=debug)
    return parse_ssim_log(ssim_log)


def parse_ssim_log(ssim_log):
    """Parse log/output files and return quality score"""
    with open(ssim_log) as fd:
        data = fd.read()
    # n:1 Y:0.985329 U:0.982885 V:0.985790 All:0.984998 (18.238620)
    # n:2 Y:0.979854 U:0.979630 V:0.983818 All:0.980478 (17.094663)
    ssim_values = []
    for line in data.splitlines():
        # break line in k:v strings
        line_items = list(item for item in line.split(" ") if ":" in item)
        ssim_values.append(
            {item.split(":")[0]: item.split(":")[1] for item in line_items}
        )
    ssim_y_list = np.array(list(float(item["Y"]) for item in ssim_values))
    ssim_u_list = np.array(list(float(item["U"]) for item in ssim_values))
    ssim_v_list = np.array(list(float(item["V"]) for item in ssim_values))
    ssim_dict = {
        "y_mean": ssim_y_list.mean(),
        "u_mean": ssim_u_list.mean(),
        "v_mean": ssim_v_list.mean(),
    }
    # add some percentiles
    ssim_dict.update(
        {
            f"y_p{percentile}": np.percentile(ssim_y_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    ssim_dict.update(
        {
            f"u_p{percentile}": np.percentile(ssim_u_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    ssim_dict.update(
        {
            f"v_p{percentile}": np.percentile(ssim_v_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    return {f"ssim_{k}": v for k, v in ssim_dict.items()}


def ffmpeg_supports_libvmaf(logfd, debug):
    libvmaf_support = False
    ffmpeg_params = [
        "-filters",
    ]
    retcode, stdout, stderr, _ = ffmpeg_run(ffmpeg_params, logfd, debug)
    assert retcode == 0, stderr
    for line in stdout.decode("ascii").splitlines():
        if "libvmaf" in line and "Calculate the VMAF" in line:
            libvmaf_support = True
    return libvmaf_support


def check_software(logfd, debug):
    # ensure ffmpeg supports libvmaf
    libvmaf_support = ffmpeg_supports_libvmaf(logfd, debug)
    assert libvmaf_support, "error: ffmpeg does not support vmaf"


def get_vmaf(distorted_filename, ref_filename, vmaf_json, logfd, debug):
    global VMAF_MODEL

    vmaf_json = (
        vmaf_json
        if vmaf_json is not None
        else tempfile.NamedTemporaryFile(prefix="vmaf.", suffix=".json").name
    )
    # ffmpeg supports libvmaf: use it (way faster)
    # important: vmaf must be called with videos in the right order
    # <distorted_video> <reference_video>
    # https://jina-liu.medium.com/a-practical-guide-for-vmaf-481b4d420d9c

    # Allow for an environment variable pointing out the VMAF model
    if os.environ.get("VMAF_MODEL_PATH", None):
        print("Environment VMAF_PATH override model", file=logfd)
        VMAF_MODEL = os.environ.get("VMAF_MODEL_PATH")
    if not os.path.isfile(VMAF_MODEL):
        print(
            f"\n***\nwarn: cannot find VMAF model {VMAF_MODEL}. Using default model\n***",
            file=logfd,
        )

    ffmpeg_params = [
        "-i",
        distorted_filename,
        "-i",
        ref_filename,
        "-lavfi",
        f"libvmaf=model=path={VMAF_MODEL}:log_fmt=json:log_path={vmaf_json}",
        "-f",
        "null",
        "-",
    ]
    retcode, _, stderr, _ = ffmpeg_run(ffmpeg_params, logfd, debug)
    assert retcode == 0, stderr
    return parse_vmaf_output(vmaf_json, VMAF_MODEL)


def parse_vmaf_output(vmaf_json, vmaf_model):
    """Parse log/output files and return quality score"""
    with open(vmaf_json) as fd:
        data = json.load(fd)
    vmaf_dict = {
        "model": os.path.basename(vmaf_model),
        "mean": data["pooled_metrics"]["vmaf"]["mean"],
        "harmonic_mean": data["pooled_metrics"]["vmaf"]["harmonic_mean"],
    }
    # get per-frame VMAF values
    vmaf_list = np.array(
        list(data["frames"][i]["metrics"]["vmaf"] for i in range(len(data["frames"])))
    )
    # add some percentiles
    vmaf_dict.update(
        {
            f"p{percentile}": np.percentile(vmaf_list, percentile)
            for percentile in PERCENTILE_LIST
        }
    )
    return {f"vmaf_{k}": v for k, v in vmaf_dict.items()}