2007年4月8日日曜日

Googleの検索結果を<簡単に>kwic表示したい

Googleの検索結果上位1000件くらいを、単純にkwic形式でコンコーダンス表示したいとずっと思っているのですが、なかなかよいツールがありません。

そこで久しぶりにGoogleのAPIについて調べてみたら、以前とはいろいろと変わっていて、現時点では、Google AJAX Search APIが最新のAPIです。
そこで、これをちょっとだけ触ってみました。
以前の、一回の検索結果取得数は10件、回数は一日1000回までという制限はなくなった模様で、ajaxで比較的簡単に処理を記述することができるようになったというのは魅力的です。
ただし、現在では、検索結果取得数は最大8件となっていて、とてもじゃありませんがコンコーダンサーとしては使えません。
今後のバージョンアップを期待したいと思います。

2007年4月7日土曜日

2007年4月5日木曜日

XML版BNCがもうすぐ来そうです

以前注文していたXML版BNCの代金が4月2日に請求されていました。
日本円で14000円ちょっとでした。安くはないけれど、価値を考えたら高くはないでしょう。

*nixでのインストール・サーバーの起動方法などに関するやや詳しい情報も出てきました。
[bnc] Installing BNC XML Edition: But I don't do Windows!

実は自宅サーバーとノートPCのVM WareにUbuntuをインストールして、そこでXaira+PHPでANCを検索できるようになっています。
ドキュメントは書きかけていますが、きちんと整形しようとすると結構面倒なのでなかなかアップしていませんが。

XML版BNCのディスクも近々来そうですし、来たら早々に環境を構築してドキュメントもアップしたいと思います。

2007年3月30日金曜日

本気で取り組むというのはこういうことなのか

英語教育に投野先生のエッセイが載っているという話を聞いて、探して読んでみました。
英語との格闘 私の英語学習遍歴 英語教育エッセイ【英語教育ニュース】

自分がいかに努力が足りないかがよく分かり、心を入れ替えてがんばろうと思いました。

2007年3月13日火曜日

XairaをLinuxにインストール中

ここ数日XairaをLinuxにインストールすべくいろいろ苦労をしています。(ある程度まとまった段階でドキュメント化する予定です。)

ドキュメントも不足している中、なんとかXairaをコンパイル・インストールするところまではできました。
しかしPHPインターフェイスを使おうと、xaira_phpをコンパイルしようとしているのですが、これがコンパイルできません。

そんな時、ふと、XairaのDebianパッケージが用意されていたはずだと思って、TEI Debian packagesからダウンロードしようと思ったのですが、なんとファイルがありません。
しかし、もしやと思ってバージョンを0.01ずつ上げて調べてみたら、なんと最新の1.23がありました!
http://tei.oucs.ox.ac.uk/teideb/binary/xaira_1.23_i386.deb

OUCSのページには最新版は1.23だと書いてあるのですが、SourceForgeのプロジェクトページには1.22までしかなく、これも気になっていたので、このDebianパッケージの1.23で試してみたいと思います。

2007年3月12日月曜日

ブログ形式にしました

発表論文などを載せているウェブサイトを全然更新していなかったので、ブログ形式にしたら少しは更新頻度が上がるかと思って、移転しました。
旧サイトにあった情報は移したつもりですが、万が一なくなっているものがありましたらご連絡ください。

2007年3月2日金曜日

TeX関係のメモ

画像関連
Word上で作成した画像ファイルはベクトル・フォントが埋め込まれた拡張メタファイル(EMF)なのできれいに拡大縮小できますが、 IllustratorではこのEMFファイルを開くことができません。(理由は不明ですがエラーになります)。このため、一度BMP化することになるのですが、その際にペイントを使うと、画像が汚くなり、これが避けられないために、最終的なEPSファイルも汚くなります。
これを避ける一つの方法は、Fireworksを使う方法です。wordの画像をクリップボードにコピーして、Fireworksで「新規作成」を選択すると、その大きさが自動的に選択されています。これできれいにBMP化できます。

きれいなPDFを作成する
dvipsk -P pdf foo.dvi
これでできるfoo.psをAcrobat Distillerで変換すると和文だけでなく欧文もきれいなPDFファイルができます。

EPSを連続して貼り込もうとしたらToo many unprocessed floats.というエラーになった

あまり多くの画像ファイルを張り込もうとすると、floatのための記憶領域が足りなくなるのか、エラーになってしまってコンパイルできなくなります。
適当なところで
\clearpage
を入れればそこで強制的に改ページされるので、そこまでの画像の配置が決まるので、エラーにならずにコンパイルできるようになります。