psv

psv - Pandas Separated Values

Copyright 2021-2024 Kurt Stephens
pypi@devdriven.com

psv is a command-line tool that manipulates tabular data in multiple formats. It is influenced by the Unix Principle of "small tools connected by pipes".

Features

psv can read and write multiple formats of data: CSV, TSV, Markdown, HTML, Pandas pickles.

The string // is used to link commands in a pipeline.

Configuration

psv reads configuration from ~/.psv/config.yml or $PSV_CONFIG_FILE.

Macros

Macro commands are defined in config.yml. Argument substitution is similar to a Unix shell: $1, $@, etc.

# ~/.psv/config.yml:
macro:
  html-full: 'html- --row-index --render-links --style --sorting --filtering --filtering-tooltip "$@"'

I/O

`in`

in - Read input.

psv in [--auto] [--raw] [FILE] [file:///FILE] [https?://URL] [-]

Aliases: i, -i

If no arguments are given, read from STDIN.

Arguments:


`FILE`	Read FILE.
`file:///FILE`	Read FILE.
`https?://URL`	GET URL.
`-`	Read STDIN.

Options:


`--auto`, `-a`	Attempt to infer format from suffix.
`--raw`, `-r`	Do not attempt infer format.

Examples:

# in: read from STDIN:
$ cat a.tsv | psv in -
a	b	c	d
1	b1	23.763	xspdf
2	b2	-98.73	qwer
3	b3	3451	bixop
1	b4	1.234	zxy

$ cat a.tsv | psv in
a	b	c	d
1	b1	23.763	xspdf
2	b2	-98.73	qwer
3	b3	3451	bixop
1	b4	1.234	zxy

# in: HTTP support:
$ psv in https://tinyurl.com/4sscj338
a	b	c	d
1	b1	23.763	xspdf
2	b2	-98.73	qwer
3	b3	3451	bixop
1	b4	1.234	zxy

`out`

out - write output to URLs.

psv out [--encoding=ENC] [FILE] [file///FILE] [https?://...] [-]

Aliases: o, o-

If no arguments are given, write to STDOUT.

Arguments:


`FILE`	Write FILE.
`file///FILE`	Write FILE.
`https?://...`	PUT URL.
`-`	Write STDOUT.

Options:


`--encoding=ENC`	Use encoding.

Examples:

# out: Convert TSV to CSV and save to a file:
$ psv in a.tsv // -tsv // csv- // out a.csv

`-sql`

-sql - Read from a SQL database.

psv -sql [--columns=COL,...] [--parse-dateslist=COL,...] [TABLE-NAME-or-SQL-QUERY] [CONNECTION-URL]

Arguments:


`TABLE-NAME-or-SQL-QUERY`	The name of a table or a SQL query.
`CONNECTION-URL`	The database connection URL in sqlachmemy format.

Options:


`--columns=COL,...`	Columns to read from table.
`--parse-dateslist=COL,...`	List of column names to parse as dates.

Examples:

# Convert CSV to sqlite table:
$ psv in gebrselassie.csv // sql- gebrselassie sqlite:////tmp/geb.db
   rows_written
0            16

# Format sqlite table as Markdown:
$ psv -sql gebrselassie sqlite:////tmp/geb.db // md
| kind          | distance     | time        | event              |
|:--------------|:-------------|:------------|:-------------------|
| Personal Best | 1500 m       | 00:03:33.73 | (Stuttgart 1999)   |
| Personal Best | 1 mile       | 00:03:52.39 | (Gateshead 1999)   |
| Personal Best | 3000 m       | 00:07:25.09 | NR (Brussels 1998) |
| Personal Best | 2 miles      | 00:08:01.08 | NBP (Hengelo 1997) |
| Personal Best | 5000 m       | 00:12:39.36 | (Helsinki 1998)    |
| Personal Best | 10000 m      | 00:26:22.75 | (Hengelo 1998)     |
| Indoors       | 800 m        | 00:01:49.35 | (Dortmund 1997)    |
| Indoors       | 1500 m       | 00:03:31.76 | (Stuttgart 1998)   |
| Indoors       | 2000 m       | 00:04:52.86 | (Birmingham 1998)  |
| Indoors       | 3000 m       | 00:07:26.15 | (Karlsruhe 1998)   |
| Indoors       | 2 miles      | 00:08:04.69 | (Birmingham 2003)  |
| Indoors       | 5000 m       | 00:12:50.38 | (Birmingham 1999)  |
| Road          | 10 km        | 00:27:02    | (Doha 2002)        |
| Road          | 10 miles     | 00:44:24    | WBP (Tilburg 2005) |
| Road          | 0.5 marathon | 00:58:55    | (Tempe 2006)       |
| Road          | marathon     | 02:03:59    | (Berlin 2008)      |

# Read specific columns:
$ psv -sql --columns=distance,time gebrselassie sqlite:////tmp/geb.db
        distance         time
0         1500 m  00:03:33.73
1         1 mile  00:03:52.39
2         3000 m  00:07:25.09
3        2 miles  00:08:01.08
4         5000 m  00:12:39.36
5        10000 m  00:26:22.75
6          800 m  00:01:49.35
7         1500 m  00:03:31.76
8         2000 m  00:04:52.86
9         3000 m  00:07:26.15
10       2 miles  00:08:04.69
11        5000 m  00:12:50.38
12         10 km     00:27:02
13      10 miles     00:44:24
14  0.5 marathon     00:58:55
15      marathon     02:03:59

# Query database:
$ psv -sql 'SELECT * FROM gebrselassie WHERE time > "00:07:"' sqlite:////tmp/geb.db // sort time
             kind      distance         time               event
0   Personal Best        3000 m  00:07:25.09  NR (Brussels 1998)
4         Indoors        3000 m  00:07:26.15    (Karlsruhe 1998)
1   Personal Best       2 miles  00:08:01.08  NBP (Hengelo 1997)
5         Indoors       2 miles  00:08:04.69   (Birmingham 2003)
2   Personal Best        5000 m  00:12:39.36     (Helsinki 1998)
6         Indoors        5000 m  00:12:50.38   (Birmingham 1999)
3   Personal Best       10000 m  00:26:22.75      (Hengelo 1998)
7            Road         10 km     00:27:02         (Doha 2002)
8            Road      10 miles     00:44:24  WBP (Tilburg 2005)
9            Road  0.5 marathon     00:58:55        (Tempe 2006)
10           Road      marathon     02:03:59       (Berlin 2008)

`sql-`

sql- - Write to SQL database.

psv sql- [--if-exists=ACTION] [DST-TABLE] [CONNECTION-URL]

Arguments:


`DST-TABLE`	Destination table name.
`CONNECTION-URL`	The database connection URL in sqlachmemy format.

Options:


`--if-exists=ACTION`	Action to take if table exists: `fail’, ‘replace’, ‘append’.

Examples:

# Convert CSV to Sqlite table:
$ psv in gebrselassie.csv // sql- gebrselassie 'sqlite:////tmp/geb.db'
   rows_written
0            16

# Query Sqlite:
$ sqlite3 -header -cmd "SELECT * FROM gebrselassie WHERE time > '00:07:'" /tmp/geb.db </dev/null
kind|distance|time|event
Personal Best|3000 m|00:07:25.09|NR (Brussels 1998)
Personal Best|2 miles|00:08:01.08|NBP (Hengelo 1997)
Personal Best|5000 m|00:12:39.36|(Helsinki 1998)
Personal Best|10000 m|00:26:22.75|(Hengelo 1998)
Indoors|3000 m|00:07:26.15|(Karlsruhe 1998)
Indoors|2 miles|00:08:04.69|(Birmingham 2003)
Indoors|5000 m|00:12:50.38|(Birmingham 1999)
Road|10 km|00:27:02|(Doha 2002)
Road|10 miles|00:44:24|WBP (Tilburg 2005)
Road|0.5 marathon|00:58:55|(Tempe 2006)
Road|marathon|02:03:59|(Berlin 2008)

Format

`table-in`

table-in - Parse table.

psv table-in [--fs=REGEX] [--rs=REGEX] [--max-cols=COUNT] [--columns=COL1,...  |] [--header] [--column=FMT] [--encoding=ENC] [--skip=REGEX]

Aliases: -table

Options:


`--fs=REGEX`	Field separator.
`--rs=REGEX`	Record separator.
`--max-cols=COUNT`	Maximum columns.
`--header`, `-h`	Column names are in first row.
`--column=FMT`	Column name printf template.
`--encoding=ENC`	Encoding of input.
`--skip=REGEX`	Records matching REGEX are skipped.

Examples:

# Parse generic table:
$ psv in users.txt // -table --fs=':'
       c1 c2     c3     c4      c5              c6                 c7
0    root  x      0      0    root           /root          /bin/bash
1  daemon  x      1      1  daemon       /usr/sbin  /usr/sbin/nologin
2     bin  x      2      2     bin            /bin  /usr/sbin/nologin
3     sys  x      3      3     sys            /dev  /usr/sbin/nologin
4   games  x      5     60   games      /usr/games  /usr/sbin/nologin
5     man  x      6     12     man  /var/cache/man  /usr/sbin/nologin
6    mail  x      8      8    mail       /var/mail  /usr/sbin/nologin
7  backup  x     34     34  backup    /var/backups  /usr/sbin/nologin
8  nobody  x  65534  65534  nobody    /nonexistent  /usr/sbin/nologin
9    sshd  x    122  65534               /run/sshd  /usr/sbin/nologin

# Skip users w/o login:
$ psv in users.txt // -table --fs=':' --skip='.*nologin'
     c1 c2 c3 c4    c5     c6         c7
0  root  x  0  0  root  /root  /bin/bash

# Generate columns named col01, col02, ...:
$ psv in users.txt // -table --fs=':' --column='col%02d'
       c1 c2     c3     c4      c5              c6                 c7
0    root  x      0      0    root           /root          /bin/bash
1  daemon  x      1      1  daemon       /usr/sbin  /usr/sbin/nologin
2     bin  x      2      2     bin            /bin  /usr/sbin/nologin
3     sys  x      3      3     sys            /dev  /usr/sbin/nologin
4   games  x      5     60   games      /usr/games  /usr/sbin/nologin
5     man  x      6     12     man  /var/cache/man  /usr/sbin/nologin
6    mail  x      8      8    mail       /var/mail  /usr/sbin/nologin
7  backup  x     34     34  backup    /var/backups  /usr/sbin/nologin
8  nobody  x  65534  65534  nobody    /nonexistent  /usr/sbin/nologin
9    sshd  x    122  65534               /run/sshd  /usr/sbin/nologin

# Set column names or generate them:
$ psv in users.txt // -table --fs=':' --columns=login,,uid,gid,,home,shell
    login c2    uid    gid      c5            home              shell
0    root  x      0      0    root           /root          /bin/bash
1  daemon  x      1      1  daemon       /usr/sbin  /usr/sbin/nologin
2     bin  x      2      2     bin            /bin  /usr/sbin/nologin
3     sys  x      3      3     sys            /dev  /usr/sbin/nologin
4   games  x      5     60   games      /usr/games  /usr/sbin/nologin
5     man  x      6     12     man  /var/cache/man  /usr/sbin/nologin
6    mail  x      8      8    mail       /var/mail  /usr/sbin/nologin
7  backup  x     34     34  backup    /var/backups  /usr/sbin/nologin
8  nobody  x  65534  65534  nobody    /nonexistent  /usr/sbin/nologin
9    sshd  x    122  65534               /run/sshd  /usr/sbin/nologin

# Convert text data to CSV:
$ psv in us-states.txt // -table --header --fs="\s{2,}" // csv- // o us-states.csv

# Split fields by 2 or more whitespace chars:
$ psv in us-states.txt // -table --header --fs="\s{2,}" // head 5 // md
|   Rank | State        |   FIPS Code | Population   |
|-------:|:-------------|------------:|:-------------|
|      1 | California   |       06000 | 39,029,342   |
|      2 | Texas        |       48000 | 30,029,572   |
|      3 | Florida      |       12000 | 22,244,823   |
|      4 | New York     |       36000 | 19,677,151   |
|      5 | Pennsylvania |       42000 | 12,972,008   |

# Split 3 fields:
$ psv in users.txt // -table --fs=':' --max-cols=3
       c1 c2     c3                                           c4
0    root  x      0                       0:root:/root:/bin/bash
1  daemon  x      1         1:daemon:/usr/sbin:/usr/sbin/nologin
2     bin  x      2                 2:bin:/bin:/usr/sbin/nologin
3     sys  x      3                 3:sys:/dev:/usr/sbin/nologin
4   games  x      5        60:games:/usr/games:/usr/sbin/nologin
5     man  x      6      12:man:/var/cache/man:/usr/sbin/nologin
6    mail  x      8           8:mail:/var/mail:/usr/sbin/nologin
7  backup  x     34     34:backup:/var/backups:/usr/sbin/nologin
8  nobody  x  65534  65534:nobody:/nonexistent:/usr/sbin/nologin
9    sshd  x    122           65534::/run/sshd:/usr/sbin/nologin

`table-out`

table-out - Generate table.

psv table-out [--fs=STR] [--rs=STR] [--header]

Aliases: table-

Options:


`--fs=STR`	Field separator.
`--rs=STR`	Record separator.
`--header`	Emit header.

Examples:

$ psv in a.csv // table-
a b c d
1 b1 23.763 xspdf
2 b2 -98.73 qwer
3 b3 3451.0 bixop
1 b4 1.234 zxy

$ psv in a.csv // table- --fs='|'
a|b|c|d
1|b1|23.763|xspdf
2|b2|-98.73|qwer
3|b3|3451.0|bixop
1|b4|1.234|zxy

`tsv-in`

tsv-in - Parse TSV.

psv tsv-in [--header]

Aliases: -tsv

Options:


`--header`	First row is header.

Examples:

# Convert TSV stdin to CSV stdout:
$ cat a.tsv | psv -tsv // csv-
a,b,c,d
1,b1,23.763,xspdf
2,b2,-98.73,qwer
3,b3,3451.0,bixop
1,b4,1.234,zxy

# Convert TSV to Markdown:
$ psv in a.tsv // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   2 | b2  |  -98.73  | qwer  |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

# Convert HTTP TSV content to Markdown:
$ psv in https://tinyurl.com/4sscj338 // -tsv // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   2 | b2  |  -98.73  | qwer  |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

`tsv-out`

tsv-out - Generate TSV.

psv tsv-out

Aliases: tsv-

Examples:

# Convert CSV to TSV:
$ psv in a.csv // tsv-
a	b	c	d
1	b1	23.763	xspdf
2	b2	-98.73	qwer
3	b3	3451.0	bixop
1	b4	1.234	zxy

`csv-in`

csv-in - Parse CSV.

psv csv-in [--header]

Aliases: -csv

Options:


`--header`	First row is header.

Examples:

# Use first row as header:
$ psv in a.csv // -csv
   a   b         c      d
0  1  b1    23.763  xspdf
1  2  b2   -98.730   qwer
2  3  b3  3451.000  bixop
3  1  b4     1.234    zxy

# Generate arbitrary columns:
$ psv in a.csv // -csv --no-header
  c1  c2      c3     c4
0  a   b       c      d
1  1  b1  23.763  xspdf
2  2  b2  -98.73   qwer
3  3  b3  3451.0  bixop
4  1  b4   1.234    zxy

# Convert CSV to JSON:
$ psv in a.csv // -csv // json-
[
  {
    "a":1,
    "b":"b1",
    "c":23.763,
    "d":"xspdf"
  },
  {
    "a":2,
    "b":"b2",
    "c":-98.73,
    "d":"qwer"
  },
  {
    "a":3,
    "b":"b3",
    "c":3451.0,
    "d":"bixop"
  },
  {
    "a":1,
    "b":"b4",
    "c":1.234,
    "d":"zxy"
  }
]

`csv-out`

csv-out - Generate CSV.

psv csv-out

Aliases: csv-, csv

Examples:

# tsv, csv: Convert TSV to CSV:
$ psv in a.tsv // -tsv // csv-
a,b,c,d
1,b1,23.763,xspdf
2,b2,-98.73,qwer
3,b3,3451.0,bixop
1,b4,1.234,zxy

`markdown-in`

markdown-in - Parse Markdown.

psv markdown-in

Aliases: -markdown, -md, md-in

Examples:

# Convert TSV to Markdown to CSV:
$ psv in a.tsv // md- // out a.md

$ psv in a.md // -md // csv
a,b,c,d
1,b1,23.763,xspdf
2,b2,-98.73,qwer
3,b3,3451,bixop
1,b4,1.234,zxy

`markdown-out`

markdown-out - Generate Markdown.

psv markdown-out

Aliases: markdown-, markdown, md-out, md-, md

Examples:

# Convert TSV on STDIN to Markdown:
$ cat a.tsv | psv -tsv // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   2 | b2  |  -98.73  | qwer  |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

`json-in`

json-in - Parse JSON.

psv json-in [--orient=ORIENT]

Aliases: -json, -js

Options:


`--orient=ORIENT`	Orientation: see pandas read_json.

`json-out`

json-out - Generate JSON array of objects.

psv json-out

Aliases: json-, json, js-, js

Examples:

# Convert CSV to JSON:
$ psv in a.csv // -csv // json- // o a.json -
[
  {
    "a":1,
    "b":"b1",
    "c":23.763,
    "d":"xspdf"
  },
  {
    "a":2,
    "b":"b2",
    "c":-98.73,
    "d":"qwer"
  },
  {
    "a":3,
    "b":"b3",
    "c":3451.0,
    "d":"bixop"
  },
  {
    "a":1,
    "b":"b4",
    "c":1.234,
    "d":"zxy"
  }
]

`dataframe-in`

dataframe-in - Read Pandas Dataframe pickle.

psv dataframe-in

Aliases: -dataframe

`dataframe-out`

dataframe-out - Write Pandas DataFrame pickle.

psv dataframe-out

Aliases: dataframe-, dataframe

`html-out`

html-out - Generate HTML.

psv html-out [--simple] [--title=NAME] [--parent-link] [--header] [--filtering] [--filtering-tooltip] [--render-link] [--sorting] [--row-index] [--stats] [--table-only] [--styled]

Aliases: html-, html

Options:


`--simple`, `-S`	Minimal format.
`--title=NAME`	Set `<title>` and add a `<div>` at the top.
`--parent-link`, `-P`	Add `..` parent link to title `<div>`.
`--header`, `-h`	Add table header.
`--filtering`, `-f`	Add filtering UI.
`--filtering-tooltip`	Add filtering tooltip.
`--render-link`, `-L`	Render http and ftp links.
`--sorting`, `-s`	Add sorting support.
`--row-index`, `-i`	Add row index to first column.
`--stats`	Add basic stats to the title `<div>`.
`--table-only`, `-T`	Render only a `<table>`.
`--styled`	Add style.

Examples:

$ psv in a.csv // html // o a.html

$ w3m -dump a.html
┌─┬──┬───────┬─────┐
│a│b │   c   │  d  │
├─┼──┼───────┼─────┤
│1│b1│23.763 │xspdf│
├─┼──┼───────┼─────┤
│2│b2│-98.73 │qwer │
├─┼──┼───────┼─────┤
│3│b3│3451.0 │bixop│
├─┼──┼───────┼─────┤
│1│b4│1.234  │zxy  │
└─┴──┴───────┴─────┘

$ psv in users.txt // -table --fs=":" // html --title=users.txt // o users-with-title.html

$ w3m -dump users-with-title.html
┌─────────────────────────────────────────────────────────────┐
│                          users.txt                          │
├──────┬──┬─────┬─────┬──────┬──────────────┬─────────────────┤
│  c1  │c2│ c3  │ c4  │  c5  │      c6      │       c7        │
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│root  │x │0    │0    │root  │/root         │/bin/bash        │
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│daemon│x │1    │1    │daemon│/usr/sbin     │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│bin   │x │2    │2    │bin   │/bin          │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sys   │x │3    │3    │sys   │/dev          │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│games │x │5    │60   │games │/usr/games    │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│man   │x │6    │12   │man   │/var/cache/man│/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│mail  │x │8    │8    │mail  │/var/mail     │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│backup│x │34   │34   │backup│/var/backups  │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│nobody│x │65534│65534│nobody│/nonexistent  │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sshd  │x │122  │65534│      │/run/sshd     │/usr/sbin/nologin│
└──────┴──┴─────┴─────┴──────┴──────────────┴─────────────────┘

$ psv in users.txt // -table --fs=":" // html --no-header // o users-no-header.html

$ w3m -dump users-no-header.html
┌──────┬─┬─────┬─────┬──────┬──────────────┬─────────────────┐
│root  │x│0    │0    │root  │/root         │/bin/bash        │
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│daemon│x│1    │1    │daemon│/usr/sbin     │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│bin   │x│2    │2    │bin   │/bin          │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sys   │x│3    │3    │sys   │/dev          │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│games │x│5    │60   │games │/usr/games    │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│man   │x│6    │12   │man   │/var/cache/man│/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│mail  │x│8    │8    │mail  │/var/mail     │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│backup│x│34   │34   │backup│/var/backups  │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│nobody│x│65534│65534│nobody│/nonexistent  │/usr/sbin/nologin│
├──────┼─┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sshd  │x│122  │65534│      │/run/sshd     │/usr/sbin/nologin│
└──────┴─┴─────┴─────┴──────┴──────────────┴─────────────────┘

$ psv in users.txt // -table --fs=":" // html -fs // o users-with-fs.html

$ w3m -dump users-with-fs.html
┌─────────────────────────────────────────────────────────────┐
│             [                    ] X 10  /  10              │
├──────┬──┬─────┬─────┬──────┬──────────────┬─────────────────┤
│  c1  │c2│ c3  │ c4  │  c5  │      c6      │       c7        │
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│root  │x │0    │0    │root  │/root         │/bin/bash        │
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│daemon│x │1    │1    │daemon│/usr/sbin     │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│bin   │x │2    │2    │bin   │/bin          │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sys   │x │3    │3    │sys   │/dev          │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│games │x │5    │60   │games │/usr/games    │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│man   │x │6    │12   │man   │/var/cache/man│/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│mail  │x │8    │8    │mail  │/var/mail     │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│backup│x │34   │34   │backup│/var/backups  │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│nobody│x │65534│65534│nobody│/nonexistent  │/usr/sbin/nologin│
├──────┼──┼─────┼─────┼──────┼──────────────┼─────────────────┤
│sshd  │x │122  │65534│      │/run/sshd     │/usr/sbin/nologin│
└──────┴──┴─────┴─────┴──────┴──────────────┴─────────────────┘

`yaml-out`

yaml-out - Generate YAML.

psv yaml-out

Aliases: yaml-, yaml, yml-, yml

Examples:

$ psv in a.csv // yaml
- a: 1
  b: b1
  c: 23.763
  d: xspdf
- a: 2
  b: b2
  c: -98.73
  d: qwer
- a: 3
  b: b3
  c: 3451.0
  d: bixop
- a: 1
  b: b4
  c: 1.234
  d: zxy

`xls-in`

xls-in - Read XLS Spreadsheet.

psv xls-in [--sheet-name=NAME] [--header]

Aliases: -xls

Options:


`--sheet-name=NAME`	Sheet name.
`--header`, `-h`	Use header.

Examples:

$ psv in a.xlsx // -xls // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   2 | b2  |  -98.73  | qwer  |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

$ psv in a.xlsx // -xls --no-header // md
| c0   | c1   | c2     | c3    |
|:-----|:-----|:-------|:------|
| a    | b    | c      | d     |
| 1    | b1   | 23.763 | xspdf |
| 2    | b2   | -98.73 | qwer  |
| 3    | b3   | 3451   | bixop |
| 1    | b4   | 1.234  | zxy   |

`xls-out`

xls-out - Generate XLS Spreadsheet.

psv xls-out [--sheet-name=NAME] [--header]

Aliases: xls-, xls

Options:


`--sheet-name=NAME`	Sheet name.
`--header`, `-h`	Generate header.

Examples:

$ psv in a.csv // xls // o a.xlsx

$ file a.xlsx
a.xlsx: Microsoft Excel 2007+

`extract`

extract - Extract fields by Regex.

psv extract [--unamed=TEMPLATE]

Aliases: rx, re, rex

Options:


`--unamed=TEMPLATE`	Column name template for unnamed groups.

Examples:

# Extract by names:
$ psv in users.txt // extract '^(?P<login>[^:]+)' // md
| login   |
|:--------|
| root    |
| daemon  |
| bin     |
| sys     |
| games   |
| man     |
| mail    |
| backup  |
| nobody  |
| sshd    |

$ psv in users.txt // extract '^(?P<login>[^:]+):(?P<rest>.*)' // md
| login   | rest                                                |
|:--------|:----------------------------------------------------|
| root    | x:0:0:root:/root:/bin/bash                          |
| daemon  | x:1:1:daemon:/usr/sbin:/usr/sbin/nologin            |
| bin     | x:2:2:bin:/bin:/usr/sbin/nologin                    |
| sys     | x:3:3:sys:/dev:/usr/sbin/nologin                    |
| games   | x:5:60:games:/usr/games:/usr/sbin/nologin           |
| man     | x:6:12:man:/var/cache/man:/usr/sbin/nologin         |
| mail    | x:8:8:mail:/var/mail:/usr/sbin/nologin              |
| backup  | x:34:34:backup:/var/backups:/usr/sbin/nologin       |
| nobody  | x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin |
| sshd    | x:122:65534::/run/sshd:/usr/sbin/nologin            |

# Extract unnamed group:
$ psv in users.txt // extract --unnamed '^(?P<login>[^:]+)(.*)' // md
| login   | c2                                                   |
|:--------|:-----------------------------------------------------|
| root    | :x:0:0:root:/root:/bin/bash                          |
| daemon  | :x:1:1:daemon:/usr/sbin:/usr/sbin/nologin            |
| bin     | :x:2:2:bin:/bin:/usr/sbin/nologin                    |
| sys     | :x:3:3:sys:/dev:/usr/sbin/nologin                    |
| games   | :x:5:60:games:/usr/games:/usr/sbin/nologin           |
| man     | :x:6:12:man:/var/cache/man:/usr/sbin/nologin         |
| mail    | :x:8:8:mail:/var/mail:/usr/sbin/nologin              |
| backup  | :x:34:34:backup:/var/backups:/usr/sbin/nologin       |
| nobody  | :x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin |
| sshd    | :x:122:65534::/run/sshd:/usr/sbin/nologin            |

# Extract unnamed groups using a template:
$ psv in users.txt // extract --unnamed='group-%d' '^(?P<login>[^:]+)(.*)' // md
| login   | group-2                                              |
|:--------|:-----------------------------------------------------|
| root    | :x:0:0:root:/root:/bin/bash                          |
| daemon  | :x:1:1:daemon:/usr/sbin:/usr/sbin/nologin            |
| bin     | :x:2:2:bin:/bin:/usr/sbin/nologin                    |
| sys     | :x:3:3:sys:/dev:/usr/sbin/nologin                    |
| games   | :x:5:60:games:/usr/games:/usr/sbin/nologin           |
| man     | :x:6:12:man:/var/cache/man:/usr/sbin/nologin         |
| mail    | :x:8:8:mail:/var/mail:/usr/sbin/nologin              |
| backup  | :x:34:34:backup:/var/backups:/usr/sbin/nologin       |
| nobody  | :x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin |
| sshd    | :x:122:65534::/run/sshd:/usr/sbin/nologin            |

Manipulation

`range`

range - Subset of rows.

psv range [--start=START] [--end=END] [--step=STEP] [start [end] [step]] [[start]:[end]:step]

Aliases: r

Arguments:


`start [end] [step]`	For 1 or more arguments.
`[start]:[end]:step`	Python-style range.

Options:


`--start=START`	Inclusive.
`--end=END`	Non-inclusive.
`--step=STEP`	Default: 1.

Examples:

# Select a range of rows:
$ psv in a.tsv // seq --start=0 // range 1 3 // md
|   a | b   |       c | d     |   __i__ |
|----:|:----|--------:|:------|--------:|
|   2 | b2  |  -98.73 | qwer  |       1 |
|   3 | b3  | 3451    | bixop |       2 |

# Every even row:
$ psv in a.tsv // seq --start=0 // range --step=2 // md
|   a | b   |        c | d     |   __i__ |
|----:|:----|---------:|:------|--------:|
|   1 | b1  |   23.763 | xspdf |       0 |
|   3 | b3  | 3451     | bixop |       2 |

`head`

head - First N rows

psv head

Aliases: h

N : Default: 10

Examples:

# head:
$ psv in us-states.txt // -table // head 5 // md
| c1   | c2         | c3    | c4         | c5         | c6   |
|:-----|:-----------|:------|:-----------|:-----------|:-----|
| Rank | State      | FIPS  | Code       | Population |      |
| 1    | California | 06000 | 39,029,342 |            |      |
| 2    | Texas      | 48000 | 30,029,572 |            |      |
| 3    | Florida    | 12000 | 22,244,823 |            |      |
| 4    | New        | York  | 36000      | 19,677,151 |      |

`tail`

tail - Last N rows

psv tail

Aliases: t

N : Default: 10

Examples:

# Last 3 rows:
$ psv in us-states.txt // -table // tail 3 // md
|   c1 | c2       | c3    | c4       | c5    | c6      |
|-----:|:---------|:------|:---------|:------|:--------|
|   49 | District | of    | Columbia | 11000 | 671,803 |
|   50 | Vermont  | 50000 | 647,064  |       |         |
|   51 | Wyoming  | 56000 | 581,381  |       |         |

`reverse`

reverse - Reverse rows. Same as "range --step=-1"

psv reverse

Aliases: tac

Examples:

# Added sequence column and reverse rows:
$ psv in a.tsv // seq // tac // md
| a   | b   | c   | d   | __i__   |
|-----|-----|-----|-----|---------|

`shuffle`

shuffle - shuffle rows.

psv shuffle [--seed=SEED]

Aliases: rand

Options:


`--seed=SEED`	String.

Examples:

$ psv in a.tsv // shuffle --seed=5 // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |
|   2 | b2  |  -98.73  | qwer  |
|   1 | b1  |   23.763 | xspdf |

`copy`

copy - Copy columns.

psv copy [SRC:DST ...]

Aliases: cp, dup

Arguments:


`SRC:DST ...`	Source and Destination columns.

Examples:

# Copy columns by name:
$ psv in a.tsv // copy b:e d:f // md
|   a | b   |        c | d     | e   | f     |
|----:|:----|---------:|:------|:----|:------|
|   1 | b1  |   23.763 | xspdf | b1  | xspdf |
|   2 | b2  |  -98.73  | qwer  | b2  | qwer  |
|   3 | b3  | 3451     | bixop | b3  | bixop |
|   1 | b4  |    1.234 | zxy   | b4  | zxy   |

`cut`

cut - Cut specified columns.

psv cut [NAME] [I] [COL:-] [*] [NAME*]

Aliases: c, x

Arguments:


`NAME`	Select name.
`I`	Select index.
`COL:-`	Remove column.
`*`	Add all columns.
`NAME*`	Any columns starting with "NAME".

Examples:

# Select columns by index and name:
$ psv in a.tsv // cut 2,d // md
| b   | d     |
|:----|:------|
| b1  | xspdf |
| b2  | qwer  |
| b3  | bixop |
| b4  | zxy   |

# Remove c, put d before other columns,
$ psv in a.tsv // cut d '*' c:- // md
| d     |   a | b   |
|:------|----:|:----|
| xspdf |   1 | b1  |
| qwer  |   2 | b2  |
| bixop |   3 | b3  |
| zxy   |   1 | b4  |

`uniq`

uniq - Return unique rows.

psv uniq

Aliases: u

`sort`

sort - Sort rows by columns.

psv sort [--reverse] [COL] [COL:-] [COL:+]

Aliases: s

Arguments:


`COL`	Sort by COL ascending.
`COL:-`	Sort by COL descending.
`COL:+`	Sort by COL ascending.

Options:


`--reverse`, `-r`	Sort descending.

Examples:

# Sort increasing:
$ psv in a.tsv // seq i // sort c // md
|   a | b   |        c | d     |   i |
|----:|:----|---------:|:------|----:|
|   2 | b2  |  -98.73  | qwer  |   2 |
|   1 | b4  |    1.234 | zxy   |   4 |
|   1 | b1  |   23.763 | xspdf |   1 |
|   3 | b3  | 3451     | bixop |   3 |

# Sort decreasing:
$ psv in a.tsv // seq i // sort -r c // md
|   a | b   |        c | d     |   i |
|----:|:----|---------:|:------|----:|
|   3 | b3  | 3451     | bixop |   3 |
|   1 | b1  |   23.763 | xspdf |   1 |
|   1 | b4  |    1.234 | zxy   |   4 |
|   2 | b2  |  -98.73  | qwer  |   2 |

# Sort by a decreasing, c increasing:
$ psv in a.tsv // seq i // md
|   a | b   |        c | d     |   i |
|----:|:----|---------:|:------|----:|
|   1 | b1  |   23.763 | xspdf |   1 |
|   2 | b2  |  -98.73  | qwer  |   2 |
|   3 | b3  | 3451     | bixop |   3 |
|   1 | b4  |    1.234 | zxy   |   4 |

$ psv in a.tsv // seq i // sort a:- c // md
|   a | b   |        c | d     |   i |
|----:|:----|---------:|:------|----:|
|   3 | b3  | 3451     | bixop |   3 |
|   2 | b2  |  -98.73  | qwer  |   2 |
|   1 | b4  |    1.234 | zxy   |   4 |
|   1 | b1  |   23.763 | xspdf |   1 |

$ psv in us-states.csv // sort 'FIPS Code' // head 10
    Rank                 State  FIPS Code  Population
23    24               Alabama       1000   5,074,296
47    48                Alaska       2000     733,583
13    14               Arizona       4000   7,359,197
32    33              Arkansas       5000   3,045,637
0      1            California       6000  39,029,342
20    21              Colorado       8000   5,839,926
28    29           Connecticut       9000   3,626,205
44    45              Delaware      10000   1,018,396
48    49  District of Columbia      11000     671,803
2      3               Florida      12000  22,244,823

$ psv in us-states.csv // cast 'FIPS Code':str // sort 'FIPS Code' // head 10
    Rank                 State FIPS Code  Population
23    24               Alabama      1000   5,074,296
44    45              Delaware     10000   1,018,396
48    49  District of Columbia     11000     671,803
2      3               Florida     12000  22,244,823
7      8               Georgia     13000  10,912,876
39    40                Hawaii     15000   1,440,196
37    38                 Idaho     16000   1,939,033
5      6              Illinois     17000  12,582,032
16    17               Indiana     18000   6,833,037
30    31                  Iowa     19000   3,200,517

`grep`

grep - Search for rows where columns match a regex.

psv grep [--all] [--any] [--fixed-strings] [--ignore-case] [--invert-match] [COL REGEX ...] [REGEX]

Aliases: g

Arguments:


`COL REGEX ...`	Select rows where COL REGEX pairs match.
`REGEX`	Select rows where REGEX is applied to all columns.

Options:


`--all`	All patterns must match.
`--any`	Any pattern must match.
`--fixed-strings`, `-F`	Match fixed string.
`--ignore-case`, `-i`	Ignore case distinctions.
`--invert-match`, `-v`	Invert the sense of matching, to select non-matching rows.

Examples:

# Match columns by regex:
$ psv in a.tsv // grep d 'x' // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

$ psv in a.tsv // grep d '^x' // md
|   a | b   |      c | d     |
|----:|:----|-------:|:------|
|   1 | b1  | 23.763 | xspdf |

$ psv in a.tsv // grep d 'x.+p' // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   3 | b3  | 3451     | bixop |

# Match where d contains "x" and b ends with "3":
$ psv in a.tsv // grep d 'x' b '3$' // md
|   a | b   |    c | d     |
|----:|:----|-----:|:------|
|   3 | b3  | 3451 | bixop |

`translate`

translate - Translate characters.

psv translate [--delete] [SRC DST COL,...] [-d DEL COL,...]

Aliases: tr

Similar to Unix tr command.

Arguments:


`SRC DST COL,...`	Map chars from SRC to DST in each COL.
`-d DEL COL,...`	Delete chars in DEL in each COL.

Options:


`--delete`, `-d`	Delete characters.

Examples:

# Change characters in specific field:
$ psv in us-states.txt // -table --header --fs="\s{2,}" // tr ',' '_' Population // head // md
|   Rank | State          |   FIPS Code |   Population |
|-------:|:---------------|------------:|-------------:|
|      1 | California     |       06000 |   39_029_342 |
|      2 | Texas          |       48000 |   30_029_572 |
|      3 | Florida        |       12000 |   22_244_823 |
|      4 | New York       |       36000 |   19_677_151 |
|      5 | Pennsylvania   |       42000 |   12_972_008 |
|      6 | Illinois       |       17000 |   12_582_032 |
|      7 | Ohio           |       39000 |   11_756_058 |
|      8 | Georgia        |       13000 |   10_912_876 |
|      9 | North Carolina |       37000 |   10_698_973 |
|     10 | Michigan       |       26000 |   10_034_113 |

# Delete characters:
$ psv in us-states.txt // -table --header --fs="\s{2,}" // tr -d ', ' // head // md
|   Rank | State         |   FIPS Code |   Population |
|-------:|:--------------|------------:|-------------:|
|      1 | California    |       06000 |     39029342 |
|      2 | Texas         |       48000 |     30029572 |
|      3 | Florida       |       12000 |     22244823 |
|      4 | NewYork       |       36000 |     19677151 |
|      5 | Pennsylvania  |       42000 |     12972008 |
|      6 | Illinois      |       17000 |     12582032 |
|      7 | Ohio          |       39000 |     11756058 |
|      8 | Georgia       |       13000 |     10912876 |
|      9 | NorthCarolina |       37000 |     10698973 |
|     10 | Michigan      |       26000 |     10034113 |

`null`

null - Does nothing.

psv null

Examples:

# Does nothing:
$ psv in a.tsv // null IGNORED --OPTION=VALUE // md
|   a | b   |        c | d     |
|----:|:----|---------:|:------|
|   1 | b1  |   23.763 | xspdf |
|   2 | b2  |  -98.73  | qwer  |
|   3 | b3  | 3451     | bixop |
|   1 | b4  |    1.234 | zxy   |

`sed`

sed - Search and replace text.

psv sed [--fixed-strings] [--ignore-case] [--convert-to-string] [COL SEARCH REPLACE ...]

Arguments:


`COL SEARCH REPLACE ...`	Search and Replace in COL.

Options:


`--fixed-strings`, `-F`	Match fixed string.
`--ignore-case`, `-i`	Ignore case distinctions.
`--convert-to-string`, `-S`	Convert all data to string first.

Examples:

# Replace Population "," with "_":
$ psv in us-states.csv // sed -F --convert-to-string @4 , _ // head 5 // md
|   Rank | State        |   FIPS Code |   Population |
|-------:|:-------------|------------:|-------------:|
|      1 | California   |        6000 |   39_029_342 |
|      2 | Texas        |       48000 |   30_029_572 |
|      3 | Florida      |       12000 |   22_244_823 |
|      4 | New York     |       36000 |   19_677_151 |
|      5 | Pennsylvania |       42000 |   12_972_008 |

Summaries

`count`

count - Count of unique column values.

psv count [--column=NAME] [COL ...]

Arguments:


`COL ...`	Columns to group by.

Options:


`--column=NAME`	Default: "count".

Examples:

# Count the number of transfers by Payer:
$ psv in transfers.csv // count Payer // md
| Payer   |   count |
|:--------|--------:|
| Alice   |       2 |
| Bob     |       4 |
| William |       1 |

# Count the number of transfers from Payer to Payee:
$ psv in transfers.csv // count Payer,Payee // md
| Payer   | Payee   |   count |
|:--------|:--------|--------:|
| Alice   | Frank   |       1 |
| Alice   | Joe     |       1 |
| Bob     | Alice   |       3 |
| Bob     | Joe     |       1 |
| William | Rich    |       1 |

# Count the number of transfers from Payee:
$ psv in transfers.csv // count --column=PayeeTransfers Payee // md
| Payee   |   PayeeTransfers |
|:--------|-----------------:|
| Alice   |                3 |
| Frank   |                1 |
| Joe     |                2 |
| Rich    |                1 |

`summary`

summary - Summary of column values.

psv summary [COL,... [STAT,...] [GROUP-BY,...]] [COL,...] [STAT,...] [GROUP-BY,...]

Arguments:


`COL,... [STAT,...] [GROUP-BY,...]`	COLs to summarize STATs grouped by GROUP-BY.
`COL,...`	Any numeric columns separated by ",".
`STAT,...`	One or more of: 'count,sum,min,max,mean,median,std,skew'.
`GROUP-BY,...`	Any column not in the COL list.

Examples:

# Summary of transfers by Payer and Payee:
$ psv in transfers.csv // summary Amount '*' Payer,Payee // md
| Payer   | Payee   |   Amount_count |   Amount_sum |   Amount_min |   Amount_mean |   Amount_median |   Amount_std |   Amount_max |   Amount_skew |
|:--------|:--------|---------------:|-------------:|-------------:|--------------:|----------------:|-------------:|-------------:|--------------:|
| Alice   | Frank   |              1 |        10.99 |        10.99 |         10.99 |           10.99 |     nan      |        10.99 |     nan       |
| Alice   | Joe     |              1 |        45.23 |        45.23 |         45.23 |           45.23 |     nan      |        45.23 |     nan       |
| Bob     | Alice   |              3 |       114.33 |         1.99 |         38.11 |           12.34 |      53.8476 |       100    |       1.66034 |
| Bob     | Joe     |              1 |        30.25 |        30.25 |         30.25 |           30.25 |     nan      |        30.25 |     nan       |
| William | Rich    |              1 |         9.33 |         9.33 |          9.33 |            9.33 |     nan      |         9.33 |     nan       |

# Summary of transfers by Payer:
$ psv in transfers.csv // summary Amount count,sum Payer // md
| Payer   |   Amount_count |   Amount_sum |
|:--------|---------------:|-------------:|
| Alice   |              2 |        56.22 |
| Bob     |              4 |       144.58 |
| William |              1 |         9.33 |

# Sum of Fee by Payee:
$ psv in transfers.csv // summary Fee sum Payee // md
| Payee   |   Fee_sum |
|:--------|----------:|
| Alice   |     15.7  |
| Frank   |      1.01 |
| Joe     |      3.75 |
| Rich    |      0.25 |

# Summary of all transfer Ammount and Fee:
$ psv in transfers.csv // cut Amount,Fee // summary Amount,Fee // md
| index   |   Amount_count |   Amount_sum |   Amount_min |   Amount_mean |   Amount_median |   Amount_std |   Amount_max |   Amount_skew |   Fee_count |   Fee_sum |   Fee_min |   Fee_mean |   Fee_median |   Fee_std |   Fee_max |   Fee_skew |
|:--------|---------------:|-------------:|-------------:|--------------:|----------------:|-------------:|-------------:|--------------:|------------:|----------:|----------:|-----------:|-------------:|----------:|----------:|-----------:|
| Amount  |              7 |       210.13 |         1.99 |       30.0186 |           12.34 |      34.1981 |          100 |       1.76746 |         nan |    nan    |     nan   |  nan       |       nan    | nan       |       nan |   nan      |
| Fee     |            nan |       nan    |       nan    |      nan      |          nan    |     nan      |          nan |     nan       |           7 |     20.71 |       0.1 |    2.95857 |         1.01 |   5.36956 |        15 |     2.5277 |

`stats`

stats - Table of column names and basic statistics.

psv stats

Examples:

$ psv in a.tsv // stats // cols // cut name,dtype.name // md
| name   | dtype.name   |
|:-------|:-------------|
| name   | object       |
| count  | int64        |
| first  | object       |
| middle | object       |
| last   | object       |
| min    | object       |
| mean   | float64      |
| median | float64      |
| max    | object       |
| std    | float64      |
| q25    | float64      |
| q50    | float64      |
| q75    | float64      |

$ psv in a.tsv // stats // cut name,count,min,max
  name  count    min     max
0    a      4      1       3
1    b      4     b1      b4
2    c      4 -98.73  3451.0
3    d      4  bixop     zxy

Types

`cast`

cast - Cast column types.

psv cast [COL:TYPES:... ...] [DST=SRC:TYPES:... ...]

Aliases: astype, coerce

TYPES:

numeric - int64 or float64.
int - int64.
float - float64.
str - str.
timedelta64 - timedelta64[ns].
datetime - datetime.
unix_epoch - Seconds since 1970.
ipaddress - Convert to ipaddress.
hostname - Convert to hostname by DNS lookup.

TYPE Aliases:

string - Alias for str.
n - Alias for numeric.
integer - Alias for int.
i - Alias for int.
f - Alias for float.
s - Alias for seconds.
sec - Alias for seconds.
td - Alias for timedelta.
dt - Alias for datetime.
ip - Alias for ipaddress.
ipaddr - Alias for ipaddress.
epoch - Alias for unix_epoch.
unix - Alias for unix_epoch.
int32 - Alias for int.
int64 - Alias for int.
float8 - Alias for float.
float64 - Alias for float.
timedelta64 - Alias for timedelta.
datetime64 - Alias for datetime.

Arguments:


`COL:TYPES:... ...`	Cast COL by TYPES.
`DST=SRC:TYPES:... ...`	Set DST column to coersion of SRC.

Examples:

$ psv in us-states.csv // shuffle // head 10 // cut State,Population // csv- // o us-states-sample.csv

$ psv in us-states-sample.csv // sort Population
           State  Population
8        Montana   1,122,867
2          Maine   1,385,340
3  New Hampshire   1,395,231
0          Idaho   1,939,033
5       Illinois  12,582,032
9   Pennsylvania  12,972,008
6       New York  19,677,151
4        Florida  22,244,823
7       Oklahoma   4,019,800
1      Louisiana   4,590,241

$ psv in us-states-sample.csv // tr -d ', ' Population // cast Population:int // sort Population
           State  Population
8        Montana     1122867
2          Maine     1385340
3  New Hampshire     1395231
0          Idaho     1939033
7       Oklahoma     4019800
1      Louisiana     4590241
5       Illinois    12582032
9   Pennsylvania    12972008
6       New York    19677151
4        Florida    22244823

# Parse date, convert to datetime, then integer Unix epoch seconds:
$ psv in birthdays.csv // cast sec_since_1970=birthday:datetime:epoch:int
    name      birthday  sec_since_1970
0    Bob     5/10/1976       200534400
1  Alice    1999-12-31       946598400
2  Frank  Aug 28, 2012      1346112000
3  Grace  Apr 27, 2011      1303862400

`unit`

unit - Convert units.

psv unit [COL:UNITS:...] [DST=SRC:UNITS:...]

Aliases: convert

The unit 1/ represents the reciprocal of the previous unit.

Arguments:


`COL:UNITS:...`	Connvert column to unit.
`DST=SRC:UNITS:...`	Set DST column to conversion of SRC.

Examples:

# Convert column c from feet to meters:
$ psv in a.csv // unit c_in_meters=c:ft:m // md
|   a | b   |        c | d     | c_in_meters           |
|----:|:----|---------:|:------|:----------------------|
|   1 | b1  |   23.763 | xspdf | 7.242962400000001 m   |
|   2 | b2  |  -98.73  | qwer  | -30.092904000000004 m |
|   3 | b3  | 3451     | bixop | 1051.8648 m           |
|   1 | b4  |    1.234 | zxy   | 0.3761232 m           |

# Convert Haile Gebrselassie's times to minutes per mile:
$ psv in gebrselassie.csv // md
| kind          | distance     | time        | event              |
|:--------------|:-------------|:------------|:-------------------|
| Personal Best | 1500 m       | 00:03:33.73 | (Stuttgart 1999)   |
| Personal Best | 1 mile       | 00:03:52.39 | (Gateshead 1999)   |
| Personal Best | 3000 m       | 00:07:25.09 | NR (Brussels 1998) |
| Personal Best | 2 miles      | 00:08:01.08 | NBP (Hengelo 1997) |
| Personal Best | 5000 m       | 00:12:39.36 | (Helsinki 1998)    |
| Personal Best | 10000 m      | 00:26:22.75 | (Hengelo 1998)     |
| Indoors       | 800 m        | 00:01:49.35 | (Dortmund 1997)    |
| Indoors       | 1500 m       | 00:03:31.76 | (Stuttgart 1998)   |
| Indoors       | 2000 m       | 00:04:52.86 | (Birmingham 1998)  |
| Indoors       | 3000 m       | 00:07:26.15 | (Karlsruhe 1998)   |
| Indoors       | 2 miles      | 00:08:04.69 | (Birmingham 2003)  |
| Indoors       | 5000 m       | 00:12:50.38 | (Birmingham 1999)  |
| Road          | 10 km        | 00:27:02    | (Doha 2002)        |
| Road          | 10 miles     | 00:44:24    | WBP (Tilburg 2005) |
| Road          | 0.5 marathon | 00:58:55    | (Tempe 2006)       |
| Road          | marathon     | 02:03:59    | (Berlin 2008)      |

$ psv in gebrselassie.csv // cast seconds=time:seconds // unit seconds:s meters=distance:m // eval 'return {"m_per_s": meters / seconds}' // unit min_per_mile=m_per_s:mile/min:1/ // cut event,distance,time,min_per_mile // md
| event              | distance     | time        | min_per_mile                  |
|:-------------------|:-------------|:------------|:------------------------------|
| (Stuttgart 1999)   | 1500 m       | 00:03:33.73 | 3.821834368 min / mile        |
| (Gateshead 1999)   | 1 mile       | 00:03:52.39 | 3.873166666666667 min / mile  |
| NR (Brussels 1998) | 3000 m       | 00:07:25.09 | 3.979460672 min / mile        |
| NBP (Hengelo 1997) | 2 miles      | 00:08:01.08 | 4.009 min / mile              |
| (Helsinki 1998)    | 5000 m       | 00:12:39.36 | 4.073571532800001 min / mile  |
| (Hengelo 1998)     | 10000 m      | 00:26:22.75 | 4.245315360000001 min / mile  |
| (Dortmund 1997)    | 800 m        | 00:01:49.35 | 3.6662868000000004 min / mile |
| (Stuttgart 1998)   | 1500 m       | 00:03:31.76 | 3.7866076160000004 min / mile |
| (Birmingham 1998)  | 2000 m       | 00:04:52.86 | 3.9276040320000005 min / mile |
| (Karlsruhe 1998)   | 3000 m       | 00:07:26.15 | 3.9889379200000006 min / mile |
| (Birmingham 2003)  | 2 miles      | 00:08:04.69 | 4.039083333333334 min / mile  |
| (Birmingham 1999)  | 5000 m       | 00:12:50.38 | 4.1326881024 min / mile       |
| (Doha 2002)        | 10 km        | 00:27:02    | 4.35059328 min / mile         |
| WBP (Tilburg 2005) | 10 miles     | 00:44:24    | 4.44 min / mile               |
| (Tempe 2006)       | 0.5 marathon | 00:58:55    | 4.497455470737914 min / mile  |
| (Berlin 2008)      | marathon     | 02:03:59    | 4.732188295165395 min / mile  |

Metadata

`add-sequence`

add-sequence - Add a column with a sequence of numbers or random values.

psv add-sequence [--column=NAME] [--start=START] [--step=STEP] [--uuid]

Aliases: seq

Options:


`--column=NAME`	Default: "i".
`--start=START`	Default: 1.
`--step=STEP`	Default: 1.
`--uuid`	Generate a UUID-4.

Examples:

# Add a column with a sequence:
$ psv in a.tsv // seq // md
|   a | b   |        c | d     |   __i__ |
|----:|:----|---------:|:------|--------:|
|   1 | b1  |   23.763 | xspdf |       1 |
|   2 | b2  |  -98.73  | qwer  |       2 |
|   3 | b3  | 3451     | bixop |       3 |
|   1 | b4  |    1.234 | zxy   |       4 |

# Start at 0:
$ psv in a.tsv // seq --start=0 // md
|   a | b   |        c | d     |   __i__ |
|----:|:----|---------:|:------|--------:|
|   1 | b1  |   23.763 | xspdf |       0 |
|   2 | b2  |  -98.73  | qwer  |       1 |
|   3 | b3  | 3451     | bixop |       2 |
|   1 | b4  |    1.234 | zxy   |       3 |

# Step by 2:
$ psv in a.tsv // seq --step=2 // md
|   a | b   |        c | d     |   __i__ |
|----:|:----|---------:|:------|--------:|
|   1 | b1  |   23.763 | xspdf |       1 |
|   2 | b2  |  -98.73  | qwer  |       3 |
|   3 | b3  | 3451     | bixop |       5 |
|   1 | b4  |    1.234 | zxy   |       7 |

# Start at 5, step by -2:
$ psv in a.tsv // seq --start=5 --step=-2 // md
|   a | b   |        c | d     |   __i__ |
|----:|:----|---------:|:------|--------:|
|   1 | b1  |   23.763 | xspdf |       5 |
|   2 | b2  |  -98.73  | qwer  |       3 |
|   3 | b3  | 3451     | bixop |       1 |
|   1 | b4  |    1.234 | zxy   |      -1 |

# Generate UUIDs:
$ psv in a.tsv // seq --uuid // md
|   a | b   |        c | d     | __i__                                |
|----:|:----|---------:|:------|:-------------------------------------|
|   1 | b1  |   23.763 | xspdf | 6c6b3d60-ab24-4baf-9073-f8bbb5ac1b79 |
|   2 | b2  |  -98.73  | qwer  | 13945e3a-7d6c-4dea-b429-e80874b3baf2 |
|   3 | b3  | 3451     | bixop | 1f1ca8fa-5841-4070-bcdf-034e616e84d8 |
|   1 | b4  |    1.234 | zxy   | 34cff4d1-20bc-4443-8f22-eddfcfa959b9 |

`rename-columns`

rename-columns - Rename columns.

psv rename-columns [OLD-COL:NEW-NAME ...]

Aliases: rename

Arguments:


`OLD-COL:NEW-NAME ...`	Columns to rename.

Examples:

# Rename column 'b' to 'Name':
$ psv in a.tsv // rename b:Name // md
|   a | Name   |        c | d     |
|----:|:-------|---------:|:------|
|   1 | b1     |   23.763 | xspdf |
|   2 | b2     |  -98.73  | qwer  |
|   3 | b3     | 3451     | bixop |
|   1 | b4     |    1.234 | zxy   |

`infer-objects`

infer-objects - Infer column types.

psv infer-objects

Aliases: infer

`show-columns`

show-columns - Table of column names and attributes.

psv show-columns

Aliases: columns, cols

See numpy.dtype.

Examples:

# Column metadata columns:
$ psv in a.tsv // cols // cols // cut name,dtype.name // md
| name            | dtype.name   |
|:----------------|:-------------|
| name            | object       |
| types           | object       |
| dtype.name      | object       |
| dtype.kind      | object       |
| dtype.char      | object       |
| dtype.num       | int64        |
| dtype.str       | object       |
| dtype.itemsize  | int64        |
| dtype.byteorder | object       |
| dtype.subdtype  | object       |
| dtype.shape     | object       |
| dtype.hasobject | bool         |
| dtype.flags     | int64        |
| dtype.isbuiltin | int64        |
| dtype.isnative  | bool         |
| dtype.descr     | object       |
| dtype.alignment | int64        |
| dtype.base      | object       |
| dtype.metadata  | object       |

# Column metadata:
$ psv in a.tsv // cols // cut name,dtype.name,dtype.kind,dtype.isnative // md
| name   | dtype.name   | dtype.kind   | dtype.isnative   |
|:-------|:-------------|:-------------|:-----------------|
| a      | int64        | i            | True             |
| b      | object       | O            | True             |
| c      | float64      | f            | True             |
| d      | object       | O            | True             |

`env-`

env- - Show env.

psv env-

Examples:

# Display proccessing info:
$ psv in a.tsv // show-columns // md // env-
{
  "cwd": "...",
  "config": {
    "file": "/dev/null",
    "file_loaded": "/dev/null"
  },
  "now": "...",
  "history": [
    [
      "<< IoIn: in a.tsv >>",
      "<< DataFrame: (4, 4) >>",
      "application/x-pandas-dataframe",
      null
    ],
    [
      "<< ShowColumns: show-columns >>",
      "<< DataFrame: (4, 19) >>",
      "application/x-pandas-dataframe",
      null
    ],
    [
      "<< MarkdownOut: markdown-out >>",
      "<< str: | name   | types     | dtype.name   |... >>",
      "text/markdown",
      null
    ],
    [
      "<< EnvOut: env- >>",
      null,
      null,
      null
    ]
  ],
  "xform": {
    "first": [
      "in",
      "a.tsv"
    ],
    "last": [
      null
    ],
    "prev": [
      null
    ],
    "next": [
      "show-columns"
    ],
    "current": [
      "<< EnvOut: env- >>",
      null,
      null,
      null
    ]
  },
  "Content-Type": "application/x-psv-env",
  "Content-Encoding": null,
  "input.paths": [
    "a.tsv"
  ]
}

Expression Evaluation

`eval`

eval - Evaluate expression for each row.

psv eval [--columns=COL,...] [--normalize] [STATEMENT ...]

Aliases: each

Variable Bindings: Columns are bound to variables:

inp : input table.
out : output table.
row : current row.
ind : row index.
offset : row offset (zero origin).

When expression returns:

"FINISH" : all remaining rows are dropped.
"BREAK" : all remaining rows (inclusive) are dropped.
False : the row is removed.
Dict : the row is updated and new columns are added.

Arguments:


`STATEMENT ...`	Statements.

Options:


`--columns=COL,...`	Columns bound within STATEMENT.
`--normalize`, `-n`	Column bound within STATEMENT are normalized to r'^[a-z0-9_]+$'.

Examples:

$ psv in a.tsv // eval 'c *= 2'
   a   b       c      d
0  1  b1  47.526  xspdf
1  2  b2 -197.46   qwer
2  3  b3  6902.0  bixop
3  1  b4   2.468    zxy

$ psv in a.tsv // eval 'return c > 0'
   a   b       c      d
0  1  b1  23.763  xspdf
1  3  b3  3451.0  bixop
2  1  b4   1.234    zxy

$ psv in a.tsv // eval 'return {"i": offset, "d_length": 2}'
   a   b         c      d  i  d_length
0  1  b1    23.763  xspdf  0         2
1  2  b2   -98.730   qwer  1         2
2  3  b3  3451.000  bixop  2         2
3  1  b4     1.234    zxy  3         2

$ psv in a.tsv // eval 'return {"c": c * 2, "f": len(d)}'
   a   b         c      d  f
0  1  b1    47.526  xspdf  5
1  2  b2  -197.460   qwer  4
2  3  b3  6902.000  bixop  5
3  1  b4     2.468    zxy  3

$ psv in a.tsv // rename d:dCamelCase // eval +n 'dCamelCase *= 2'
   a   b       c  dCamelCase
0  1  b1  23.763  xspdfxspdf
1  2  b2  -98.73    qwerqwer
2  3  b3  3451.0  bixopbixop
3  1  b4   1.234      zxyzxy

$ psv in a.tsv // rename d:dCamelCase // eval -n 'd_camel_case *= 2'
   a   b       c  dCamelCase
0  1  b1  23.763  xspdfxspdf
1  2  b2  -98.73    qwerqwer
2  3  b3  3451.0  bixopbixop
3  1  b4   1.234      zxyzxy

`select`

select - Select rows.

psv select [LOGICAL-EXPRESSION ...]

Aliases: where

When expression is True, the row is selected. "BREAK" and "FINISH" conditions in eval command also apply.

Arguments:


`LOGICAL-EXPRESSION ...`	Logical expression.

Examples:

$ psv in a.tsv // select "c > 0"
   a   b       c      d
0  1  b1  23.763  xspdf
1  3  b3  3451.0  bixop
2  1  b4   1.234    zxy

`repl`

repl - Start an interactive REPL.

psv repl [`inp`] [`out`]

Arguments:


`inp`	Input table.
`out`	Output table; copy of `inp`.

Documentation

`example`

example - Show examples.

psv example [--run] [--generate] SEARCH-STRING

Aliases: ex, examples

Arguments:


`SEARCH-STRING`	Matches name, aliases, brief.

Options:


`--run`, `-r`	Run examples.
`--generate`	Generate and save examples.

`help`

help - This help document.

psv help [--verbose] [--list] [--plain] [--raw] [--sections] [--markdown]

Options:


`--verbose`, `-v`	Show more detail.
`--list`, `-l`	List commands.
`--plain`, `-p`	Show plain docs.
`--raw`, `-r`	Raw detail.
`--sections`, `-s`	List sections.
`--markdown`	Emit Markdown.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.github/workflows		.github/workflows
.vscode		.vscode
bin		bin
build		build
doc		doc
example		example
lab		lab
lib/psv		lib/psv
tests		tests
tmp		tmp
tool		tool
vendor		vendor
.coveragerc		.coveragerc
.env		.env
.gitignore		.gitignore
.gitmodules		.gitmodules
.mypy.ini		.mypy.ini
.pycodestyle		.pycodestyle
.pylintrc		.pylintrc
README.md		README.md
dev-requirements.txt		dev-requirements.txt
requirements.txt		requirements.txt

kstephens/psv

Folders and files

Latest commit

History

Repository files navigation

psv

Features

Configuration

Macros

I/O

in

out

-sql

sql-

Format

table-in

table-out

tsv-in

tsv-out

csv-in

csv-out

markdown-in

markdown-out

json-in

json-out

dataframe-in

dataframe-out

html-out

yaml-out

xls-in

xls-out

extract

Manipulation

range

head

tail

reverse

shuffle

copy

cut

uniq

sort

grep

translate

null

sed

Summaries

count

summary

stats

Types

cast

unit

Metadata

add-sequence

rename-columns

infer-objects

show-columns

env-

Expression Evaluation

eval

select

repl

Documentation

example

help

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

`in`

`out`

`-sql`

`sql-`

`table-in`

`table-out`

`tsv-in`

`tsv-out`

`csv-in`

`csv-out`

`markdown-in`

`markdown-out`

`json-in`

`json-out`

`dataframe-in`

`dataframe-out`

`html-out`

`yaml-out`

`xls-in`

`xls-out`

`extract`

`range`

`head`

`tail`

`reverse`

`shuffle`

`copy`

`cut`

`uniq`

`sort`

`grep`

`translate`

`null`

`sed`

`count`

`summary`

`stats`

`cast`

`unit`

`add-sequence`

`rename-columns`

`infer-objects`

`show-columns`

`env-`

`eval`

`select`

`repl`

`example`

`help`

Packages