csvkit命令行操作csv文件初体验

  |   0 评论   |   0 浏览

背景

命令行操作csv文件

初体验

安装

pip3 install csvkit

查看

cat 123.csv | csvlook

查看指定列

查看第一列

csvcut -c 1 student.csv

按名字提取列

csvcut -c name student.csv

查看除去第二列的其他列

csvcut -C 2 student.csv

对指定列做分析

csvcut -c taobao_zhibo_wangdan get.csv | csvstat

结果

Type of data:          Number
        Contains null values:  True (excluded from calculations)
        Unique values:         20
        Smallest value:        7.99
        Largest value:         100
        Sum:                   636.96
        Mean:                  19.302
        Median:                8.19
        StDev:                 30.435
        Most common values:    100 (4x)
                               7.99 (3x)
                               8.18 (3x)
                               8.26 (3x)
                               8.25 (3x)

sql分析

计算score的均值

csvsql --query "select avg(score) from student;" student.csv

选出score大于85行

csvsql --query "select * from student where score > 85;" student.csv

参考