2005-02-28 Mon
* 訳して通知 [l]
久しぶりに yakushite.net を訪ねる。そうしたら、進化したサービスが
提供されていたことを初めて知る。
あの翻訳エンジン使って、監視しているページの更新があったら、それを
原文と訳文をメールで送信してくれるサービスらしい。
http://www.oki.com/jp/Home/JIS/New/OKI-News/2005/02/z04136.html
労力なく監視できちゃうネットの特性を活かしたサービスって、これから
も増えそうですね。
2005-02-22 Tue
* GB [r]
Dyama さんが、MED のかじりを紹介してくれる。情報幾何的な解釈
projection もさわりだけ。受信側が勉強不足だから、なんとなく、面白
そう、ってとこまでしか、共有できなかったけど。孝ちゃんが、Boosting
as Entropy Projection を読んでいるとき、「目的は現在の仮説分布と似
たような分布を選びたい。でも、間違ったものへの重みをアップするよう
に制約をかけたい。」といってくれて、すっきり。
高村さんは ICA再訪。自分では絶対に追えない内容だけど、ご自分のこと
ばで解説してくださるから、わかりやすい。今回紹介してくれた方法は、
従来と違って事前分布を取り込める方がスマートらしい。そもそもICA は、
難しすぎる問題を解こうとしている感がある。最後のパラメータチューニ
ングは、heuristics というか問題ドメインの鋭い洞察がないと、なかな
か精度がでそうにないですね。
孝ちゃんは、Boosting とあれネタについて、いろいろ。Dyama さんが、
オブジェクト指向プログラミングの極意を伝授してくれる。ふむふむ。ま
だ私は汎用クラス消費者レベルだなぁ。生産者レベルまでスキルアップし
たいものだ。
奥村研輪講。
最後が私。とりあえず、I-world とデータ前処理の説明。説明がヘタレだ
から、誤解を招いてしまった。えっと、簡単にいうと、unsupervised に
モデル学習(ざっくりいうと、確率つき対訳辞書を構築)して、そいつと
未定のアルゴリズムをつかって、decode することを考えている。力点は
decode 手法、I-world のデータは評価データとしてしか利用しない、と
いう方針を明確に表明しなかったのが、敗因。まだ、何を評価すべきか、
分かっていないから、しごくマトモな指摘にも、意味不明な返ししかでき
ない。××
皆さんお疲れなのに、あーでもない、こーでもないといろいろ知恵を下さ
る。最後に、これは、まさに、あれで解けますよ、って高村さんの頭には
ひらめきがあったようだ。が、私は鈍いので、キャッチできない。Dyama
さんが少し解説を加えてくれた。わかった気分にだけなった。意図を理解
するのに、もう少し、時間が必要。勉強しないと。
夜、KMも一緒に、町田で打ち上げ。3ヶ月ぶりぐらいで、飲み会等々に参
加。疲れがピークだったからか、何をしゃべったか覚えていない。
2005-02-18 Fri
2005-02-13 Sun
* ごめんなさい [r]
年次大会の原稿について、ごめんなさい。
- しめきりを守れませんでした。8日午後に提出しました。
- 開かない pdf を送ってしまいました。
その後、鳥澤先生からメールがあったのですが、タイミング悪くて、お
返事が遅れてしまいました。ごめんなさい。
- 3週間前に提出したアブストラクトと実際の原稿の内容がかなり異なり
ます。「fail to でっちあげ」(copyright Dyama) になりました。
- 謝辞書くのを忘れました。
本研究は、工藤拓氏の実装を参考にしました。貴重な助言もいただきました。感謝いたします。
言語資源を開発された方々にも、感謝の意を申し上げます。
山田寛康氏、高村大也氏、乾孝司氏、坪井祐太氏から、有意義なコメントをいただきました。各氏に感謝申し上げます。
- ポスター用の ppt を準備していたら、致命的なミスが見つかりました。
誤植その1:P(y|x) 式の exp に、括弧をつけ忘れました。
誤植その2:P(y|x) 式の添字が間違っていました。
誤植その3:対訳素性 singleton の属性の順番と実際に学習された対訳
素性の属性の順番が対応していませんでした。わかりにくさを増やしてし
まって申し訳ないです。ちなみに、学習された素性の重みは正しいです。
- 誤解を招く記述がいくつかありました。特に、「基本辞書」と「基本シ
ナリオ」は、同じ用語を使ってしまいましたが、関係ありません。「基本
シナリオ」でも、辞書を追加していますが、その追加シナリオが基本だ、
という意味です。
原稿は、今回の小さな思いつきは徒労に終りましたという、負の結果なの
で、読む価値ないんですが、読んでしまった方々へ、お知らせいたします。
そんなに苦労して、ぜんぜん旨味がないじゃん、と言われれば、それまで
のお話です。後で冷静に考えると、今回の話は、うまくいかなくて当然な
のかも。新語形成で重要な音韻論的な視点を反映していないし、そもそも
英語以外の借用語も結構あるし…。
2005-02-05 Sat
* サイエンスZERO [l]
コンピュータ将棋。結構面白かったです。つるおかさんも出演されていま
した。お元気そう。たしか、局面のなりやすさを確率モデル化した仕事も
されておられたから、番組では、評価関数に関してコメントされておられ
ました。
あそびごごろが刺激されるんだろう。こういう題材は、ウケがいい。機械
翻訳も、私にとっては、究極の「動くことばのオモチャ」なのよね。私は、
日本語も英語もまったく別ルートで生成しているから、翻訳機能が貧弱。
感覚的には、翻訳は、暗号解読にちかい。ま、一生かけて、楽しみながら、
解読プロセスを実装していくつもり。
盛んに、出演していた人工知能研究者が、いかにコンピュータ将棋が有意
義な研究課題であるかを力説していた。こういう説得能力って重要かも。
福岡で働いていたとき、先輩から「工学系研究者は、材料で遊びたおして、
みんなに、幸せとゆめを届ける商売なんだよ。」といわれた。まだ、その
ころ、私は、理学の人間だったから、とても、生意気だったんだろうなぁ。
未踏とか、科研とか、ベンチャーとか、とてもとおーい世界だけど、他人
にも面白いと思ってもらえる着想は、研究でも日常生活でも重要だよな。
職業研究をやめても、日常を大切して、センスを磨いていこう。
で、現実は…。まだ、実験中。なんか大切なこと、見落としているんだ。
うーん。
2005-02-01 Tue
* 2月のゼミ [o]
25日になったようだ。がーん。
久しぶりに K さんによるカーネル周りの最近の進展がまとめて聞けると
楽しみにしておりましたが…。くどうくんとも、ここんとこ、御無沙汰だっ
たし…。自分への外部刺激として、おふたりの「目から鱗」を感じさせて
くれる話を、とても楽しみにしていたんだけど…。
あー、それにしても、残念。
せめて午後だけでも参加したいけど、ゼミだから仕方ない。ガマンガマン。
この間の、情報処理の編集とかもされておられたし、K さんもご活躍され
ておられるみたい。すごい。最近、アルゴリズム周りで調べものして、久
しぶりに S さんの講義ノートを読ませてもらったり。こちらもすごい。
あと少しで、こういう生活ともお別れするけど、同僚だけにとどまらず、
研究を通して、外部のすごい方々と出会えたことも財産だな、と感じる、
今日この頃。