WP2TXT 0.2.0 公開

WP2TXTのバージョン0.2.0をリリースしました。WP2TXTはWikipediaのデータベース・ダンプファイル(XMLとMediaWikiフォーマットで整形、bz2形式で圧縮)を展開・解析し、指定したサイズのプレーンテキストに変換・分割するプログラムです。
0.2.0の特徴は次の通りです。
- 日本語以外の言語に対応(XML/MediaWikiをまじめにパーズするようにした。)
- Windows用ファイル(exe)とMac用(app)の実行ファイルを用意(WinはVista、MacはLeopard 10.5.6でテスト。WinはXPでも大丈夫と思いますが、MacはTiger以前では無理でしょう。)
- 0.1.0で付けていた1行1センテンス形式への変換機能はなくした(処理に時間がかかりすぎるので。いずれ別のプログラムとして公開するかも。)
作業自体はずっと前に行い、そのままになっていました。テストが不十分ということもあり、公開は先延ばしにしていましたが、前のバージョンを使ってくれている方がちらほらおられることを知り、新バージョンをリリースすることにしました。
プログラミング言語はRubyを使っています。Win用のexeを作成するには Exerb を、Mac用のappを作成するのには Platypus を利用しています。GUIは WxRuby です。
≪ Prev entry |
| Next entry ≫