<<< >>> 最新 / kaoru's clog

ChangeLog 2005-02

2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

2005-02-28 Mon

* 訳して通知 [l]

久しぶりに yakushite.net を訪ねる。そうしたら、進化したサービスが
提供されていたことを初めて知る。

あの翻訳エンジン使って、監視しているページの更新があったら、それを
原文と訳文をメールで送信してくれるサービスらしい。

http://www.oki.com/jp/Home/JIS/New/OKI-News/2005/02/z04136.html

労力なく監視できちゃうネットの特性を活かしたサービスって、これから
も増えそうですね。

2005-02-25 Fri

* PRMU 研究会 [l]

刺激的な一日でした。
許可して下さりありがとうございます > O村先生

2005-02-23 Wed

* 考える仕事をしはじめると、 [l]

自動スリープになってしまったので、帰ります。再起動してきます。

* 残りの1000文も仕上げた [l]

今日は、朝からヘトヘトで、何にも考えられない。よって、事務処理
とコーパス整備をこなす。

* 突風 [l]

すずかけ台駅からキャンパスまでの、あの急な坂道。
今日は、頭がフラついていたからだろうか。見事に、飛ばされた。

自分では、前進するように努力していたが、実際は、後退していた。
まるで、今の私の研究みたいで、笑えた。

2005-02-22 Tue

* GB [r]

Dyama さんが、MED のかじりを紹介してくれる。情報幾何的な解釈
projection もさわりだけ。受信側が勉強不足だから、なんとなく、面白
そう、ってとこまでしか、共有できなかったけど。孝ちゃんが、Boosting
as Entropy Projection を読んでいるとき、「目的は現在の仮説分布と似
たような分布を選びたい。でも、間違ったものへの重みをアップするよう
に制約をかけたい。」といってくれて、すっきり。

高村さんは ICA再訪。自分では絶対に追えない内容だけど、ご自分のこと
ばで解説してくださるから、わかりやすい。今回紹介してくれた方法は、
従来と違って事前分布を取り込める方がスマートらしい。そもそもICA は、
難しすぎる問題を解こうとしている感がある。最後のパラメータチューニ
ングは、heuristics というか問題ドメインの鋭い洞察がないと、なかな
か精度がでそうにないですね。

孝ちゃんは、Boosting とあれネタについて、いろいろ。Dyama さんが、
オブジェクト指向プログラミングの極意を伝授してくれる。ふむふむ。ま
だ私は汎用クラス消費者レベルだなぁ。生産者レベルまでスキルアップし
たいものだ。

奥村研輪講。

最後が私。とりあえず、I-world とデータ前処理の説明。説明がヘタレだ
から、誤解を招いてしまった。えっと、簡単にいうと、unsupervised に
モデル学習(ざっくりいうと、確率つき対訳辞書を構築)して、そいつと
未定のアルゴリズムをつかって、decode することを考えている。力点は
decode 手法、I-world のデータは評価データとしてしか利用しない、と
いう方針を明確に表明しなかったのが、敗因。まだ、何を評価すべきか、
分かっていないから、しごくマトモな指摘にも、意味不明な返ししかでき
ない。××

皆さんお疲れなのに、あーでもない、こーでもないといろいろ知恵を下さ
る。最後に、これは、まさに、あれで解けますよ、って高村さんの頭には
ひらめきがあったようだ。が、私は鈍いので、キャッチできない。Dyama
さんが少し解説を加えてくれた。わかった気分にだけなった。意図を理解
するのに、もう少し、時間が必要。勉強しないと。

夜、KMも一緒に、町田で打ち上げ。3ヶ月ぶりぐらいで、飲み会等々に参
加。疲れがピークだったからか、何をしゃべったか覚えていない。

* ぐったり [l]

ぐったりです。

2005-02-21 Mon

* 懲りずに、敗北してしまった。 [o]

どうしても、多様なエラーに対応できず、変換スクリプトを書くのをあき
らめた。3時間もくもくと、手で修正してしまいました。でも、終わった
のは1000文。

こんな××な作業をしてはいけない。心がすさむ。
この無謀な挑戦に、挫折しそう。めげそう。xxxxxxxxxxxxxxxxx

* 季節外れのサンタクロース? [o]

F木さんが、マシンをかついできた。(悲しい事情があったみたい)
格好がちょうどサンタクロース。(出前のおにーちゃん説も浮上したんだが)
それにしても、重そうに肩にかついでいる絵が、なんとも痛ましかった。

2005-02-20 Sun

* Welcome to the I-world [r]

英語もなんとも厄介。終わらない…。日本語同様、かなり、てこずる。
せめて、ベースラインの実験を報告したいと思っていたが…。
もう、無理。

2005-02-18 Fri

* 加湿&温風 [o]

奥村研に潜んでいた電化製品らしい。今シーズンの運用開始。快適。

* 修論&卒論 [o]

奥村研の一員として自覚がないんじゃないか、とお叱りを受けそう。

修論は、練習に参加せず、本番を聴講しました。
# 体調管理ができていないので…
卒論は、練習に参加して、本番は聴講しませんでした。
# 大岡山は遠い…

* お昼ごはん [o]

最初は、お偉方さんたちと食堂にいっていましたが、私の心の歯車が故障
したころから、桑畑さんとご一緒させてもらっている。心理面でサポート
してもらう。それだけじゃない、物資面も。りんご、かぼちゃ、などなど。
今日も、しゃべって、聞いて、楽しかった。これぞ、癒し。日常の幸せ。

* Welcome to the I-world [r]

日本語側の読みときパーザを仕上げる。
だけど、ルールをたくさん書いても、とりこぼしが残る。
手で修正しちゃった。目先の快楽を求めてしまった。
もうちょい頑張ると、partially labelled word alignment corpus ができそう。
でも、この調子だと、間に合わない。前回同様、やばいですねぇ。
とにかく、枝葉末節なことはほっといて、がんばろぉー。

あ、やばい。翻訳学校の宿題がまだ残ってた。寝ようと思ったのに。むむむぅ。

2005-02-17 Thu

* 点滴 [l]

昨日からヘロヘロさんだったので、朝一番に、病院へ。
その後ゆっくり昼前に出勤。
ラッシュをはずした出勤って、こんなに楽やったんか。

2005-02-16 Wed

* 貧血 [l]

朝から、ふらふら。動いていないと、自動的にスリープ状態に。
くわはたさんによると、どうも「顔色が悪い」らしい。

2005-02-15 Tue

* Welcome to the I-world [r]

広義の辞書と解析器がほしい。
辞書は、I-to-J 辞書と J 言語で書かれた I-pedia かな?
解析器は、I-parser と I-to-J translator。I-paraphraser ではダメ。

時間かけて何度読み返しても、わからへん。
5月、9月、と失敗して、3度目の正直で気合いを入れて挑んだが、激沈。

ALT-JAWS があると謎解きに役立つかもしれないけど、気安めにしかなら
んだろう。根の部分がさっぱりつかめない。頭悪すぎ>私

あー、めげそう。というか、もう、投げ出したい。許されないけど。

2005-02-13 Sun

* ごめんなさい [r]

年次大会の原稿について、ごめんなさい。

- しめきりを守れませんでした。8日午後に提出しました。

- 開かない pdf を送ってしまいました。
  その後、鳥澤先生からメールがあったのですが、タイミング悪くて、お
  返事が遅れてしまいました。ごめんなさい。

- 3週間前に提出したアブストラクトと実際の原稿の内容がかなり異なり
  ます。「fail to でっちあげ」(copyright Dyama) になりました。

- 謝辞書くのを忘れました。

本研究は、工藤拓氏の実装を参考にしました。貴重な助言もいただきました。感謝いたします。
言語資源を開発された方々にも、感謝の意を申し上げます。
山田寛康氏、高村大也氏、乾孝司氏、坪井祐太氏から、有意義なコメントをいただきました。各氏に感謝申し上げます。

- ポスター用の ppt を準備していたら、致命的なミスが見つかりました。

誤植その1:P(y|x) 式の exp に、括弧をつけ忘れました。

誤植その2:P(y|x) 式の添字が間違っていました。

誤植その3:対訳素性 singleton の属性の順番と実際に学習された対訳
素性の属性の順番が対応していませんでした。わかりにくさを増やしてし
まって申し訳ないです。ちなみに、学習された素性の重みは正しいです。

- 誤解を招く記述がいくつかありました。特に、「基本辞書」と「基本シ
ナリオ」は、同じ用語を使ってしまいましたが、関係ありません。「基本
シナリオ」でも、辞書を追加していますが、その追加シナリオが基本だ、
という意味です。

原稿は、今回の小さな思いつきは徒労に終りましたという、負の結果なの
で、読む価値ないんですが、読んでしまった方々へ、お知らせいたします。

そんなに苦労して、ぜんぜん旨味がないじゃん、と言われれば、それまで
のお話です。後で冷静に考えると、今回の話は、うまくいかなくて当然な
のかも。新語形成で重要な音韻論的な視点を反映していないし、そもそも
英語以外の借用語も結構あるし…。

* 右クリック [l]

とにかく、年度末にかけて、MS系ソフトを使う機会が増えるのだが、普段
から親しんでいないし、まして、愛情なんでかけらも注いでいないので、
ストレスがたまる。そんなときに、右クリックおまじないを忘れないでお
きたい。

2005-02-12 Sat

* 翻訳学校 [t]

一般常識(雑学知識)をつけなさい、って怒られる。日頃の勉強が足りな
い、とも言われた。根気をもって取り組め、らしい。

日頃の行ないと愛情もっては、計算機とのつき合いだけじゃなかったのね。

どうも、職業翻訳者にもなれそうにない。職業研究者にもなれてないし。
要するに、職業人失格ってことみたい。あぁー。

2005-02-11 Fri

* Welcome to the I-world again [r]

終日格闘。ちと、解読成功。残された課題多し。

2005-02-10 Thu

* バタッ。 [l]

社会人失格。自己管理ができてない。

2005-02-09 Wed

* Welcome to the I-world [r]

気合いをいれて、再度挑戦。今日は、進歩がなかった。

2005-02-05 Sat

* サイエンスZERO [l]

コンピュータ将棋。結構面白かったです。つるおかさんも出演されていま
した。お元気そう。たしか、局面のなりやすさを確率モデル化した仕事も
されておられたから、番組では、評価関数に関してコメントされておられ
ました。

あそびごごろが刺激されるんだろう。こういう題材は、ウケがいい。機械
翻訳も、私にとっては、究極の「動くことばのオモチャ」なのよね。私は、
日本語も英語もまったく別ルートで生成しているから、翻訳機能が貧弱。
感覚的には、翻訳は、暗号解読にちかい。ま、一生かけて、楽しみながら、
解読プロセスを実装していくつもり。

盛んに、出演していた人工知能研究者が、いかにコンピュータ将棋が有意
義な研究課題であるかを力説していた。こういう説得能力って重要かも。
福岡で働いていたとき、先輩から「工学系研究者は、材料で遊びたおして、
みんなに、幸せとゆめを届ける商売なんだよ。」といわれた。まだ、その
ころ、私は、理学の人間だったから、とても、生意気だったんだろうなぁ。
未踏とか、科研とか、ベンチャーとか、とてもとおーい世界だけど、他人
にも面白いと思ってもらえる着想は、研究でも日常生活でも重要だよな。
職業研究をやめても、日常を大切して、センスを磨いていこう。

で、現実は…。まだ、実験中。なんか大切なこと、見落としているんだ。
うーん。

2005-02-02 Wed

* あのー、この一文を訳してください。 [o]

最近の聞かれること、トップ。
個人的には、「最近どう?」の方がましな導入だと思う。

2005-02-01 Tue

* 2月のゼミ [o]

25日になったようだ。がーん。

久しぶりに K さんによるカーネル周りの最近の進展がまとめて聞けると
楽しみにしておりましたが…。くどうくんとも、ここんとこ、御無沙汰だっ
たし…。自分への外部刺激として、おふたりの「目から鱗」を感じさせて
くれる話を、とても楽しみにしていたんだけど…。

あー、それにしても、残念。

せめて午後だけでも参加したいけど、ゼミだから仕方ない。ガマンガマン。

この間の、情報処理の編集とかもされておられたし、K さんもご活躍され
ておられるみたい。すごい。最近、アルゴリズム周りで調べものして、久
しぶりに S さんの講義ノートを読ませてもらったり。こちらもすごい。

あと少しで、こういう生活ともお別れするけど、同僚だけにとどまらず、
研究を通して、外部のすごい方々と出会えたことも財産だな、と感じる、
今日この頃。


01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12

<<< >>> 最新 / kaoru's clog