找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 47615|回复: 19

[问题求助] 如何用powershell将一个csv文件平均分成N份并保留标题头

[复制链接]
发表于 2021-12-17 12:33:26 | 显示全部楼层 |阅读模式
本帖最后由 5i365 于 2021-12-17 21:15 编辑

遇到一个csv文件, 太长了, 想把它平均分成N份并保留标题头, 新文件名在原文件名基础上加序号
这里有个不能平均等分的情况: 例如下面的例子, 歌曲只有9首, 平均分成4份, 那最后一首歌就存到一个文件
百度了一些资料, 看了下都是翻译的国外的, 看不太懂, 请求高手支招

CSV文件内容如下:

排序,语言,歌手,歌名
1,国语,付雪,金玉良缘
2,国语,阿吉太组合,阿衣莫
3,国语,洛先生,孤城
4,国语,刘艺雯,听闻远方有你
5,国语,海来阿木,五十年以后
6,国语,海来阿木,浮生记
7,国语,杨小壮,最后的人
8,国语,莫叫姐姐,你能不能不要离开我 (莫叫语版)
9,国语,郁可唯,路过人间
 楼主| 发表于 2021-12-18 07:19:10 | 显示全部楼层
本帖最后由 5i365 于 2021-12-18 07:24 编辑

在国外找到一个工具,简直就是为我量身定制的, 太牛B了, 分享给大家

下载链接
https://www.erdconcepts.com/dbtoolbox/csvsplitter/csvsplitter.zip
 楼主| 发表于 2021-12-18 07:23:47 | 显示全部楼层
另外在国外so上找到一个用sed的方法, 代码只有4行, 但是不知道sed在哪里下载, 也不知道那个option选项怎么设置, 期待高手能解释一下, 多谢, 代码如下:

header=$(head -1 $file)
data=$(tail -n +2 $file)

echo $data | split [options...] -
在选项中,您必须指定块的大小以及结果文件名的模式。尾随-不能删除,因为它指定从stdin读取数据。

然后可以在每个文件的顶部插入头
sed -i "1i$header" $splitOutputFile
发表于 2021-12-18 09:49:16 | 显示全部楼层
大部分文本编辑器都有这种功能啊,比如EmEditor可按行或书签分割文本,分割后的文件名可定制,速度秒杀。
发表于 2021-12-18 19:10:09 | 显示全部楼层
  1. $d="abc.csv"
  2. $a=type $d
  3. $b=4
  4. [int]$c=$a.count/$b
  5. for($i=1;$i -lt $a.count;$i+=$c){
  6. sc ("{0}-{1:d3}.txt" -f $d,$f++) ($a[0],$a[$i..($i+$c-1)])
  7. }
复制代码

评分

参与人数 1技术 +1 收起 理由
5i365 + 1 很精炼

查看全部评分

发表于 2021-12-18 19:34:57 | 显示全部楼层
回复 3# 5i365


sed命令可以从这里下载:
http://bcn.bathome.net/s/tool/index.html?key=sed

不过你找到的这几行代码是Linux Shell脚本,无法直接在Windows里面直接执行。
 楼主| 发表于 2021-12-18 19:56:13 | 显示全部楼层
回复 5# idwma

感谢大侠帮忙, 话说真是比上面的软件轻巧, 软件要一两M的大小

现在执行后文件名是这样的, abc.csv-000.txt
如何改成abc-000.csv
 楼主| 发表于 2021-12-18 20:00:12 | 显示全部楼层
回复 5# idwma


   我在下面这个贴子里,采用了您的第一行cmd代码, 让他执行ps, 貌似,直接在what-if 时显示的结果正确, 但一执行就不行, 不知道为什么
http://www.bathome.net/redirect. ... 1038&pid=249399
 楼主| 发表于 2021-12-18 20:07:15 | 显示全部楼层
回复 6# Batcher


    感谢提醒, 我记得以前您在我的别的贴子就提过sed ,代码不能通用吗?
发表于 2021-12-18 20:16:20 | 显示全部楼层
回复 7# 5i365

what-if这个问题不会呀
  1. $d="abc.csv"
  2. $a=type $d
  3. $b=4
  4. [int]$c=$a.count/$b
  5. for($i=1;$i -lt $a.count;$i+=$c){
  6. sc ("{0}-{1:d3}.{2}" -f ($d -replace '^(.*)\..*','$1'),$f++,($d -replace '^.*\.(.*)$','$1')) ($a[0],$a[$i..($i+$c-1)])
  7. }
复制代码
 楼主| 发表于 2021-12-18 20:29:28 | 显示全部楼层
回复 10# idwma


    我懂的太浅了, {}中的代码,一点也看不懂了
发表于 2021-12-19 19:45:24 | 显示全部楼层
回复 9# 5i365


    3楼代码是Linux Shell的语法,跟sed是否通用没啥必然联系吧。
 楼主| 发表于 2021-12-19 20:26:19 | 显示全部楼层
回复 12# Batcher


    不是有win版吗? win版 没有上面的功能吗? 不是太懂, 所以就问一下
发表于 2021-12-19 20:42:24 | 显示全部楼层
回复 13# 5i365


我换个方式试试看:

header=$(head -1 $file)
data=$(tail -n +2 $file)
echo $data | split [options...] -
上面3行是Linux Shell脚本,分割文件主要是Linux split命令的作用。

sed -i "1i$header" $splitOutputFile
sed命令只是在最后一步完成了添加表头的功能,Window里面如果你已经完成了分割文件的操作,也能用类似的sed命令来添加表头。
 楼主| 发表于 2021-12-19 20:44:03 | 显示全部楼层
回复 14# Batcher


    多谢解释, 明白了个大概, 感觉还是powershell 好用些
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 06:27 , Processed in 0.021138 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表