テキストファイルからKWICコンコーダンスを生成するCGIスクリプトを探しました。
そんなものはいくらでもあるだろうと思ったのですが、探し方が悪かったのか、意外にもほとんどありませんでした。
その中で見つけたのがPerlconcです。
まだ一部機能が実装されていないなどの残念な点はありますが、正規表現を使って複数のテキストが自由に選択できて、見やすいですし、割と良さそうな感じです。
ただ、開発が0.3で完全に止まっていますし、今後のアップデートもないでしょう。
また、230行目の「href」の前の二重引用符がエスケープされていないため、そのままではエラーとなります。
この点だけ修正すれば、最低限使うことはできます。
これをベースにいろいろ手を入れていけば使いやすいものにできそうです。
あるいは、この実装を参考にゼロから作り直した方が早いかもしれませんが。
その後さっそく改造して、Unicode対応にして、日本語のファイル名・テキスト・検索キーワードも適切に扱えるようにました。
これでそれなりに使えるようになりました。
いずれ気が向いたら公開するかもしれません。
0 件のコメント:
コメントを投稿