csvkit命令行操作csv文件初体验
背景
命令行操作csv文件
初体验
安装
pip3 install csvkit
查看
cat 123.csv | csvlook
查看指定列
查看第一列
csvcut -c 1 student.csv
按名字提取列
csvcut -c name student.csv
查看除去第二列的其他列
csvcut -C 2 student.csv
对指定列做分析
csvcut -c taobao_zhibo_wangdan get.csv | csvstat
结果
Type of data:          Number
        Contains null values:  True (excluded from calculations)
        Unique values:         20
        Smallest value:        7.99
        Largest value:         100
        Sum:                   636.96
        Mean:                  19.302
        Median:                8.19
        StDev:                 30.435
        Most common values:    100 (4x)
                               7.99 (3x)
                               8.18 (3x)
                               8.26 (3x)
                               8.25 (3x)
sql分析
计算score的均值
csvsql --query "select avg(score) from student;" student.csv
选出score大于85行
csvsql --query "select * from student where score > 85;" student.csv
 我的开源
我的开源