[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] 如何用powershell将一个csv文件平均分成N份并保留标题头

本帖最后由 5i365 于 2021-12-17 21:15 编辑

遇到一个csv文件, 太长了, 想把它平均分成N份并保留标题头, 新文件名在原文件名基础上加序号
这里有个不能平均等分的情况: 例如下面的例子, 歌曲只有9首, 平均分成4份, 那最后一首歌就存到一个文件
百度了一些资料, 看了下都是翻译的国外的, 看不太懂, 请求高手支招

CSV文件内容如下:

排序,语言,歌手,歌名
1,国语,付雪,金玉良缘
2,国语,阿吉太组合,阿衣莫
3,国语,洛先生,孤城
4,国语,刘艺雯,听闻远方有你
5,国语,海来阿木,五十年以后
6,国语,海来阿木,浮生记
7,国语,杨小壮,最后的人
8,国语,莫叫姐姐,你能不能不要离开我 (莫叫语版)
9,国语,郁可唯,路过人间

本帖最后由 5i365 于 2021-12-18 07:24 编辑

在国外找到一个工具,简直就是为我量身定制的, 太牛B了, 分享给大家

下载链接
https://www.erdconcepts.com/dbtoolbox/csvsplitter/csvsplitter.zip

TOP

另外在国外so上找到一个用sed的方法, 代码只有4行, 但是不知道sed在哪里下载, 也不知道那个option选项怎么设置, 期待高手能解释一下, 多谢, 代码如下:

header=$(head -1 $file)
data=$(tail -n +2 $file)

echo $data | split [options...] -
在选项中,您必须指定块的大小以及结果文件名的模式。尾随-不能删除,因为它指定从stdin读取数据。

然后可以在每个文件的顶部插入头
sed -i "1i$header" $splitOutputFile

TOP

大部分文本编辑器都有这种功能啊,比如EmEditor可按行或书签分割文本,分割后的文件名可定制,速度秒杀。

TOP

  1. $d="abc.csv"
  2. $a=type $d
  3. $b=4
  4. [int]$c=$a.count/$b
  5. for($i=1;$i -lt $a.count;$i+=$c){
  6. sc ("{0}-{1:d3}.txt" -f $d,$f++) ($a[0],$a[$i..($i+$c-1)])
  7. }
复制代码
1

评分人数

TOP

回复 3# 5i365


sed命令可以从这里下载:
http://bcn.bathome.net/s/tool/index.html?key=sed

不过你找到的这几行代码是Linux Shell脚本,无法直接在Windows里面直接执行。
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

回复 5# idwma

感谢大侠帮忙, 话说真是比上面的软件轻巧, 软件要一两M的大小

现在执行后文件名是这样的, abc.csv-000.txt
如何改成abc-000.csv

TOP

回复 5# idwma


   我在下面这个贴子里,采用了您的第一行cmd代码, 让他执行ps, 貌似,直接在what-if 时显示的结果正确, 但一执行就不行, 不知道为什么
http://www.bathome.net/redirect. ... 1038&pid=249399

TOP

回复 6# Batcher


    感谢提醒, 我记得以前您在我的别的贴子就提过sed ,代码不能通用吗?

TOP

回复 7# 5i365

what-if这个问题不会呀
  1. $d="abc.csv"
  2. $a=type $d
  3. $b=4
  4. [int]$c=$a.count/$b
  5. for($i=1;$i -lt $a.count;$i+=$c){
  6. sc ("{0}-{1:d3}.{2}" -f ($d -replace '^(.*)\..*','$1'),$f++,($d -replace '^.*\.(.*)$','$1')) ($a[0],$a[$i..($i+$c-1)])
  7. }
复制代码

TOP

回复 10# idwma


    我懂的太浅了, {}中的代码,一点也看不懂了

TOP

回复 9# 5i365


    3楼代码是Linux Shell的语法,跟sed是否通用没啥必然联系吧。
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

回复 12# Batcher


    不是有win版吗? win版 没有上面的功能吗? 不是太懂, 所以就问一下

TOP

回复 13# 5i365


我换个方式试试看:

header=$(head -1 $file)
data=$(tail -n +2 $file)
echo $data | split [options...] -
上面3行是Linux Shell脚本,分割文件主要是Linux split命令的作用。

sed -i "1i$header" $splitOutputFile
sed命令只是在最后一步完成了添加表头的功能,Window里面如果你已经完成了分割文件的操作,也能用类似的sed命令来添加表头。
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

回复 14# Batcher


    多谢解释, 明白了个大概, 感觉还是powershell 好用些

TOP

返回列表