当前位置:首页 > 日志 > 正文内容

超大文本TXT去重复的工具软件及方法

光的传人11年前 (2015-03-04)日志18408

找了大半天的超大文本去重复软件,竟然没有一个能够真正支持超大文本的(755M的TXT就提示内存溢出,无法运行)!试用的部分小软件如下图所示:

还有很多不是单文件的用后不行就直接删除了,可以说能下载到的这类小工具基本上都试了,没有一个能够胜任超大文本去重复这个简单的功能!号称的极速去重复等等软件工具,基本上加在了755M的TXT,不是卡死就是内存错误而退出。这可怎么办呢?超大文本怎样去重复呢?搜索到的方法有的还牵扯到易语言、脚本等等更高级的东西,可我就只是需要一个简单软件,谷歌、百度搜索都搜不出来呢!

幸运的是,无意间下载了一个号称“超大TXT打开器”的软件,当时下载只是想看看700多M的TXT用这个打开速度咋样(速度确实很快,不到一分钟),没想到这成了救命稻草!这个软件名字大部分人应该都见过,就是传说中的最佳文本编辑器——EmEditor(我用的是EmEditorPro,就是专业版本的),很容易下载的,这里就不提供下载了。

超大文本TXT去重复工具:EmEditorPro(经测试去重复700多万的数据还是能在短时间内解决的,再多了就会越来越慢,耗时未知~)

超大文本TXT去重复方法:

1、选中所有数据,点击右键,选择“高级”→“删除重复行”(这不正是我们需要的功能么)。

2、确定就可以开始了,一千八百多万(1800万)数据去重复效果如下:

3、最后一步应该是去重复后保存吧,未测试到此步。补充:经过测试,当数据到达700多万的时候,就开始会变得很慢,越来越慢,但是不会卡死。

4、注意:必须是数据完全相同的重复行才能被成功删除掉,否则哪怕是多一个空格,EmEditor也不会将其算作重复行。

就说到这里吧,剩下的就靠电脑配置了~应该是非常快的!由于工作电脑配置较差、时间有限,暂时测试到这里,等用高配置电脑再测试一下超大文本去重复所需要的时间,再更新吧!

扫描二维码推送至手机访问。

版权声明:本文由光的传人博客www.liu16.com发布,如需转载请注明出处。

本文链接:http://www.liu16.com/post/txt去重复.html

标签: 经验教程
分享给朋友:

相关文章

《尸鬼》观后感

《尸鬼》观后感

《尸鬼》,一个并不知名的日本恐怖动画片,本来我是没有兴趣看动漫的,更没有兴趣看日本动漫,但是老婆大人一发话:必须得看,并且看完后写读后感!于是就有了本文!本部动漫故事发生在一个深藏在大山里的村庄,从一个向往大城市的小女孩——清水小慧遭遇神奇...

织梦编辑器复制粘贴文本会自动添加div标签,最简单去除方法

织梦编辑器复制粘贴文本会自动添加div标签,最简单去除方法

作为一款开源cms,织梦系统确实有不少漏洞爆出来,而且很多是高危漏洞——但是最近一两年却是没有什么大的漏洞爆出,因为用的人多发现的问题也多,修复后问题就少了,这就是开源的好处。最近要做一个网站,测试了很多个开源cms(asp的、php的),...

谷歌镜像竟然出现了官网!为了钱百度也是拼了

谷歌镜像竟然出现了官网!为了钱百度也是拼了

闲来无事看了下本博客的流量来源,发现之前一个流量比较大的关键词来源竟然没有了,这个关键词就是“谷歌镜像”。于是就顺手搜了一下这个关键词,不搜索不知道,一搜索下了一跳,百度再次刷新了我的三观:“谷歌镜像”这个关键词竟然也给一个不知名的网站加了...

错误号:3002(aspcms)提示:【加载文件失败】解决方法

错误号:3002(aspcms)提示:【加载文件失败】解决方法

最近刚做的一个自适应平台的企业站,整理好资料、做好漏洞防范后上传到服务器,发现网站的产品详细页面、文章详细页面访问出错,提示:【加载文件失败】,错误号:3002,错误描述:文件无法被打开。这是怎么回事呢?在制作aspcms模板的时候,光的传...

谷歌浏览器Chrome 48.0.2564.82稳定版右键手势最小化托盘解决方法(鼠标手势冲突)

谷歌浏览器Chrome 48.0.2564.82稳定版右键手势最小化托盘解决方法(鼠标手势冲突)

今天刚刚升级了谷歌浏览器Google Chrome 48.0.2564.82稳定版,好像是昨天刚刚发布的(其实每次升级都是强迫症导致的,根本没感觉出来功能升级到什么地方了),不过这次发现升级后的最大一个特点了:鼠标手势不好用了(我安装了鼠标...

评论列表

白洋淀
9年前 (2017-03-13)

原来pro版的EmEditor还有 这么个好用的功能,真是谢谢楼主了。感谢分享!

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。