2017年2月18日土曜日

WindowsへのTreeTaggerのインストール方法

すぐに忘れてしまうので、WindowsへのTreeTaggernoインストール方法をメモしておきます。
(以下は英語の場合の説明です。)



まず、
http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/
から
tree-tagger-windows-3.2.zip
english-par-linux-3.2-utf8.bin.gz
の2ファイルをダウンロードします。(バージョンはこの記事を執筆時点のものです。)

次に、
tree-tagger-windows-3.2.zip
内のTreeTaggerフォルダを任意の場所に置きます。
それから、
english-par-linux-3.2-utf8.bin.gz
内のenglish-utf8を上記TreeTagger\libに置きます。
最後に、TreeTagger\bin内のtagger-english.batの3行目の
set TAGDIR=C:\TreeTagger
を実際のディレクトリに変更します。

パスを通したりしなくても、これだけで、
(フルパス)\tagger-english 処理したいファイル > 出力
とするとタグ付けができます。

Windowsのコマンドプロンプトで同一フォルダ内の同一拡張子のファイルをまとめる方法

Windowsのコマンドプロンプトで同一フォルダ内の同一拡張子のファイルをまとめる方法の覚え書きです。
type *.txt > all
ポイントは出力先ファイルには入力ファイルと同じ拡張子を付けないということです。
出力先に、まとめる入力ファイルと同じ拡張子を付けてしまうと、出力先として意図したファイルも入力されてしまって内容が重複してしまうためです。