`
RednaxelaFX
  • 浏览: 3016529 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

将Comiket物的文件名格式统一化的脚本

    博客分类:
  • Ruby
阅读更多
又到了Comiket大潮,抓下来的文件的名字总是格式不统一,按照文件名排序来查看很不方便。于是又到了出动Ruby的时间~
(每次到批量重命名文件的时候我的第一反应就是打开irb……)
这次的脚本在好几个类别的目录下都能用,所以顺便记下来。

脚本作用:将类似"(Cxx)(item_type)[circle_name] item_name"的文件名中开头部分的空格调整到:前缀标签间不包括空格,标签整体与后面的文件名之间留一个空格。普通文件和目录都是重命名的目标。不符合这种带有两组圆括号和一组方括号为前缀标签的文件则不在重命名目标范围内。我一般是用另外的脚本来把顺序都倒到这个顺序上然后再一起抽掉空格。
限制:如果文件名中出现了在当前系统locale下无法显示出来的字符,那么那个文件的重命名会失败;重命名失败不会影响后续循环,失败的文件名会显示到stderr。反正有特殊字符的文件/目录不会很多,暂时就手工修改算了 OTL
Ruby 1.8自身的编码是有点问题,而Ruby 1.9的字符串虽然能用UNICODE,但在执行这种操作的时候似乎还是处理不了。怪哉,可能我没写对还是怎样。回头再试试看。

#!/usr/bin/env ruby

def reformat_comiket_folder(dir='.')
  Dir.entries(dir).each do |p|
    begin
      if p =~ /^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$/
        File.rename p, "(#{$1})(#{$2})[#{$3}] #{$4}"
      end
    rescue SystemCallError
      $stderr.puts 'IO failed: ' + $!
    end
  end
end

if __FILE__ == $0
  reformat_comiket_folder ARGV[0] || '.'
end


其实用这脚本心里有点痒……又想起之前在写的重命名工具了。找个时间把它写完就好了 T T

========================================================================

当然咯,用C#来写这个程序就不会出现编码问题。采用跟上面相似的逻辑,重写为:

using System;
using System.IO;
using System.Linq;
using System.Text.RegularExpressions;

sealed class ReformatComiketFiles {
    static bool TryGetRenameName(
        Regex pattern,
        string input,
        string format, // format items in this param correspond to match.Groups[1..$]
        out string result ) {

        var match = pattern.Match( input );
        if ( match.Success ) {
            var str = string.Format( format,
                                     match.Groups
                                         .Cast<Group>( )
                                         .Skip( 1 )
                                         .Select( g => g.Value )
                                         .ToArray( ) );
            result = str;
            return str != src; // using a local variable here saves an indirect read
        } else {
            result = input;
            return false;
        }
    }

    static void Main( string[ ] args ) {
        DirectoryInfo root;
        if ( 0 < args.Length ) {
            root = new DirectoryInfo( args[ 0 ] );
        } else {
            root = new DirectoryInfo( Environment.CurrentDirectory );
        }
        var pattern = new Regex( @"^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$" );

        foreach ( var dir in root.GetDirectories( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    dir.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine(dest);
                dir.MoveTo( Path.Combine( dir.Parent.FullName, dest ) );
            }
        }

        foreach ( var file in root.GetFiles( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    file.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine( dest );
                file.MoveTo( Path.Combine( file.DirectoryName, dest ) );
            }
        }
    }
}


试了下,似乎都能行。运行环境是.NET Framework 3.5 SP1。
于是把编译出来的exe发到附件里。有需要的拿~
分享到:
评论
3 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……

觉得值得对比一下,用F#也写了一个版本:http://rednaxelafx.iteye.com/blog/311741
有兴趣的话讨论一下~~我写F#代码还不是特别顺手……

2 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……
其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

呃呵呵,这次已经没有很积极的去收了,但资源不断的涌入这也就收下了 OTL

用Groovy来写这样的脚本是不错,出来的代码跟Ruby的也差不了多少。
但是用F#/OCaml来写我看不出有什么优势,因为整个脚本并没有多少纯计算的,几乎都是需要产生副作用的一些操作。除非不用正则表达式来匹配,但是手工匹配要多写那么多代码,就失去脚本快捷方便的意义了。不过如果有什么我没想到的办法来通过F#完成这功能,我很有兴趣知道~~
1 楼 CloudiDust 2009-01-07  
好想法……去用Groovy或者F#写一个……

其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

相关推荐

    Doujin-Release-Tracker:已弃用

    同人发布追踪器最初以跟踪我在Comiket上期待的内容的方式开始,但现在... 希望他们将是适当的文档,但是通常端点是: /[comiket, vocamas, m3] -显示我们记录的所有活动的数据,其ID,日期和论坛链接/[comiket, vocama

    Search Extension For Comike Web Catalog-crx插件

    函数中添加右键单击菜单以搜索在浏览器上选择的字符串Comiket Web目录它是一个扩展名。 圆形名称,yomigana和作者姓名是针对性的。 如果有1个搜索结果,请自动移动到圆圈详细信息页面。 Comiket Web目录帐户并登录是...

    利用CNN进行无人售货机的商品识别.zip

    无人机最强算法源码,易于部署和学习交流使用

    node-v9.11.0-sunos-x86.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    ch-PP-OCRv2-det.onnx

    PP-OCR det

    基于TensorFlow的无人机机动飞行LSTM 时序动作网络.zip

    无人机最强算法源码,易于部署和学习交流使用

    ISO 16750-1-2023中文.pdf

    ISO 16750-1-2023中文.pdf

    node-v6.11.3-x86.msi

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    infrared-remote-controller-master

    旅行商问题

    ch-PP-OCRv3-det.onnx

    PP-OCR det

    电赛第二次积分赛无人机,实现循迹、识别图形与其颜色、串口通讯等功能.zip

    无人机最强源码,无人机算法,易于部署和学习交流使用

    node-v10.1.0-linux-arm64.tar.xz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    基于TMS320VC5416 设计DSP最小系统开发板硬件(原理图+PCB)工程文件.zip

    基于TMS320VC5416 设计DSP最小系统开发板硬件(原理图+PCB)工程文,PCB硬件采用2层板设计,大小为99*75mm,USB D型接口供电,包括AD设计的原理图和PCB文件,可以做为你的学习及设计参考。

    node-v6.9.4-x86.msi

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

    基于OpenCV+MySQL+QT实现的人脸识别考勤系统源码.zip

    基于OpenCV+MySQL+QT实现的人脸识别考勤系统源码.zip 本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 基于OpenCV+MySQL+QT实现的人脸识别考勤系统源码.zip 本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 基于OpenCV+MySQL+QT实现的人脸识别考勤系统源码.zip 本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 基于OpenCV+MySQL+QT实现的人脸识别考勤系统源码.zip 本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。

    基于matlab实现的matlab中的通信工具箱中simulink搭建直接序列扩频系统并进行仿真.rar

    基于matlab实现的matlab中的通信工具箱中simulink搭建直接序列扩频系统并进行仿真.rar

    大疆无人机集成.zip

    无人机最强源码,无人机算法,易于部署和学习交流使用

    安卓无人机.zip

    无人机最强源码,无人机算法,易于部署和学习交流使用

    ch_ppocr_mobile_v2.0_rec.onnx

    PP-OCR rec

Global site tag (gtag.js) - Google Analytics