csvkit命令行操作csv文件初体验
背景
命令行操作csv文件
初体验
安装
pip3 install csvkit
查看
cat 123.csv | csvlook
查看指定列
查看第一列
csvcut -c 1 student.csv
按名字提取列
csvcut -c name student.csv
查看除去第二列的其他列
csvcut -C 2 student.csv
对指定列做分析
csvcut -c taobao_zhibo_wangdan get.csv | csvstat
结果
Type of data: Number
Contains null values: True (excluded from calculations)
Unique values: 20
Smallest value: 7.99
Largest value: 100
Sum: 636.96
Mean: 19.302
Median: 8.19
StDev: 30.435
Most common values: 100 (4x)
7.99 (3x)
8.18 (3x)
8.26 (3x)
8.25 (3x)
sql分析
计算score的均值
csvsql --query "select avg(score) from student;" student.csv
选出score大于85行
csvsql --query "select * from student where score > 85;" student.csv