当前位置:首页 > 日志 > 正文内容

超大文本TXT去重复的工具软件及方法

光的传人11年前 (2015-03-04)日志18470

找了大半天的超大文本去重复软件,竟然没有一个能够真正支持超大文本的(755M的TXT就提示内存溢出,无法运行)!试用的部分小软件如下图所示:

还有很多不是单文件的用后不行就直接删除了,可以说能下载到的这类小工具基本上都试了,没有一个能够胜任超大文本去重复这个简单的功能!号称的极速去重复等等软件工具,基本上加在了755M的TXT,不是卡死就是内存错误而退出。这可怎么办呢?超大文本怎样去重复呢?搜索到的方法有的还牵扯到易语言、脚本等等更高级的东西,可我就只是需要一个简单软件,谷歌、百度搜索都搜不出来呢!

幸运的是,无意间下载了一个号称“超大TXT打开器”的软件,当时下载只是想看看700多M的TXT用这个打开速度咋样(速度确实很快,不到一分钟),没想到这成了救命稻草!这个软件名字大部分人应该都见过,就是传说中的最佳文本编辑器——EmEditor(我用的是EmEditorPro,就是专业版本的),很容易下载的,这里就不提供下载了。

超大文本TXT去重复工具:EmEditorPro(经测试去重复700多万的数据还是能在短时间内解决的,再多了就会越来越慢,耗时未知~)

超大文本TXT去重复方法:

1、选中所有数据,点击右键,选择“高级”→“删除重复行”(这不正是我们需要的功能么)。

2、确定就可以开始了,一千八百多万(1800万)数据去重复效果如下:

3、最后一步应该是去重复后保存吧,未测试到此步。补充:经过测试,当数据到达700多万的时候,就开始会变得很慢,越来越慢,但是不会卡死。

4、注意:必须是数据完全相同的重复行才能被成功删除掉,否则哪怕是多一个空格,EmEditor也不会将其算作重复行。

就说到这里吧,剩下的就靠电脑配置了~应该是非常快的!由于工作电脑配置较差、时间有限,暂时测试到这里,等用高配置电脑再测试一下超大文本去重复所需要的时间,再更新吧!

扫描二维码推送至手机访问。

版权声明:本文由光的传人博客www.liu16.com发布,如需转载请注明出处。

本文链接:http://www.liu16.com/post/txt去重复.html

标签: 经验教程
分享给朋友:

相关文章

jav,是什么?什么意思?原来jav是javlibrary或javzoo!打不开怎么办?

jav,是什么?什么意思?原来jav是javlibrary或javzoo!打不开怎么办?

无意间发现某个福利吧网站的搜索来源词中,一个英文词的搜索量很让人震惊,那就是jav!简单的三个字母到底是什么意思呢?百度搜索结果竟然寥寥无几,怎么回事?难道是不明觉厉的一个词?看百度相关下拉搜索,java?不可能吧!javlibrary?貌...

收到移动10086短信,不要轻信!联通10010也是

收到移动10086短信,不要轻信!联通10010也是

昨晚在坐公交的时候,收到一条10086发来的信息,信息如下:尊敬的用户;您的手机花费积分可以兑换价值50元的话费礼包了请用手机登陆网址;http://baid.us/pVdD进行下载安装打开激活24小时内系统自动充值成功在此先来分析下这条短...

shopex后台登陆不上,没反应,返回登陆页面解决方法

shopex后台登陆不上,没反应,返回登陆页面解决方法

又一次shopex的后台问题,真让人头痛!之前解决过一次《shopex后台登陆空白,解决方法合集 》,采纳了网上所有方法,还是不行,最终通过自己思考,借鉴其他程序解决方法解决了!还有一次是《shopex后台验证码不显示解决方法大全》,也是搜...

苏宁内购会会很便宜吗?苏宁、国美内购会会员日其实就是一个促销活动

苏宁内购会会很便宜吗?苏宁、国美内购会会员日其实就是一个促销活动

好久没有写博客了,没想到一写就要写好几篇(关于苏宁的)。先从当初的苏宁内购会开始说起。九月初,准备买大家电,想从实体店购买,于是就开始转悠各大电器商场,什么国美、苏宁等等。转了不少大商场,其实都差不多,所谓大家电商场,无非是把各大品牌的电器...

使用小马激活工具KMS10激活win10后,主页被劫持跳转hao123解决方法大全

使用小马激活工具KMS10激活win10后,主页被劫持跳转hao123解决方法大全

今晚测试了一下俄罗斯大神(老毛子@lopatkin)精简版的win10系统正式版(Windows 10 Pro 精简版10240.16393.150717-1719.th1_st1 x86-x64 CN PIP FINAL),下载下来64位...

aspcms系统产品详情模板页面[news:title]失效解决方法

aspcms系统产品详情模板页面[news:title]失效解决方法

正在使用的aspcms系统可能是比较早的版本了,一直没有比较大的问题。但是在修改产品详情页面时,用代码{aspcms:cimages contentid=[product:id]} [cimages:src] [news:title] {/...

评论列表

白洋淀
9年前 (2017-03-13)

原来pro版的EmEditor还有 这么个好用的功能,真是谢谢楼主了。感谢分享!

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。