春山 征吾のくけー

https://www.unixuser.org/~haruyama/blog/ に移転しました http://wiki.livedoor.jp/haruyama_seigo/d/FrontPage @haruyama タイトルが思いつかないときはそのときかかってた曲をタイトルにしています.

2012年03月

Anuenue 0.7.3 リリースと 0.7.4 リリース予告

Anuenue 0.7.3 をリリースしました. mixi 社内での管理のためにシェルスクリプトに機能を追加しています.

そして Anuenue 0.7.4 をリリース予定です. java.io.FileReader を利用していたために, TSV ファイルの読み込みが locale に依存してしまい, 正しい文書が更新されない場合がありました. たとえば locale が 設定されていないと更新に高い確率で失敗します.

0.7.4 では FileReader は利用せず, java.io.FileInputStream と java.io.InputStreamReader を用いて, ava.io.InputStreamReader で UTF-8 encoding を強制することでこの問題をなくします.

今日明日でテストを行ない問題がなければリリースします.

テスト環境では *.UTF-8 がLC_ALLなどに設定されていたためこの問題に気付きませんでした. locale について指定していない cron からのコマンド呼び出しで問題があることがわかりました.

2012/03/22-2012/03/25

2012/03/22 夜サッカーした.

2012/03/23 会社の納会で飯をくいまくった. 次の日にサッカーをするので酒は飲まなかった.

2012/03/24 サッカーした. 1-1(0-1, 1-0) で引き分け. グラウンドに大きなみずたまりが何箇所もあって, サッカーするべきではない状態だった. 後半のみ出場. グラウンド状況に関係ない部分でもプレーはだめだめだった.

2012/03/25 サッカーした. 0-0 で引き分け. 後半のみ出場. けっこううまく守れた.

24日と25日ではチームが違う. サッカーのレベルは似たようなものなのに, 24日のチームだといいプレーができないが, 25日のチームではそれなりにプレーできる.

日本語入力を支える技術 ―変わり続けるコンピュータと言葉の世界 のサンプルコードの学習の部分にバグがある.

「graph != result」 となっている2箇所は 「sentence!= result」でないとおかしい.

ただし, 効率が悪くなるがほとんど結果には影響しないはず.

徳永さんには連絡済み.

今週も週4日サッカーする予定.

2012/03/13 - 2012/03/21

今後は何日分かまとめて記述するようにしよう.

2012/03/13 と 2012/03/15 の夜サッカーした.

2012/03/16 までは業務でポジネガ分析用の辞書(形容詞と絵文字と顔文字)を作っていた. 既存の辞書を用いて教師データを作りシンプルな分類器で分類したものを目で精査して新しい辞書を作成, というのを何度も繰り返したところなかなかいい感じの辞書ができた.

2012/03/18 はサッカーの試合. 先制されたが追い付いた. 1本コーナーキックからシュートしたが枠外. 順位を決めるための PK 戦で勝利. 私は蹴らなかった.

2012/03/19 は夜サッカー. SICP 読書会は, 参加率が悪かったのでもともと中止の予定だった.

2012/03/20 haruyama/ime-sample ・ GitHub に, 学習のコードを足してみた. SVM にはまだ手を付けてなくて パーセプトロンのみ.

哲学が異なる言語間で移植するとなかなか面白い.

徳永さんのサンプルコード(ruby) の中の以下のメソッドを

  def convert_to_nodes(sentence)
    ret = []
    bos = Node.new("", "", 0)
    ret.push bos
    i = 0
    prev = bos

    sentence.each{|x|
      i += x[1].length
      node = Node.new(x[0], x[1], i)
      node.prev = prev
      ret.push node
      prev = node
    }

    eos = Node.new("", "", i+1)
    eos.prev = prev
    ret.push eos

    return ret
  end

私は Clojure で以下のように書いた.

        (fn [sentence]
          (defn- iter [sen ret prev i]
            (if (empty? sen)
              (let [
                    eos (node/make "" "" (+ i 1))
                    ]
                ((eos :set_prev!) prev)
                (conj ret eos))
              (let [
                    x (first sen)
                    j (+ i (count (second x)))
                    node (node/make (first x) (second x) j)
                    ]
                ((node :set_prev!) prev)
                (recur (rest sen) (conj ret node) node j))))
          (let [
                bos (node/make "" "" 0)
                ]
            (iter sentence [bos] bos 0)))

2012/03/21 明日会社の勉強会で統計の教科書の内容をまとめた物を発表するための資料作り.

2012/03/12 When You Reach Me を読了

2012/03/12 When You Reach Me(Rebecca Stand) を読了. この落ちはあまり好きじゃない.

SICP読書会を開催. 今日はそれほど難しくなかったかな? その後反省会を2時間ほど.

はてなは 2004年の事件で登録をやめて, その後は閲覧者としてしか関わっていない.

はてなへの住所登録の義務化撤回について

2004年のときの対応は私は良く思わなかった. だいぶ前の話なのでしっかり覚えているわけではないが.

今日はテキストマイニングの真似事をした. 精度をあげるには結局地道な努力が必要そうだ.

2012/03/10 サッカー中止 2012/03/11 うさぎドロップ 9.5 10 を購入

2012/03/10 サッカーがグラウンド不良で中止に. 家事をして英語の勉強をして酒飲んで寝た.

2012/03/11 うさぎドロップ 9.5 と 10 を購入. 9.5 のほうは買わなくてもよかった.

When You Reach Me (Rebecca Stead) を 3/4 くらい読んだ. 最初は散漫な話だなと思ったが中盤からは面白くなってきた.

2011/03/08 サッカーした 2011/03/09 特記事項なし

2011/03/08 サッカーした. 姿勢を良くしてプレーすることをこころがけたら少しミスが減った感じ.

昼は 私的勉強会と学会の未来_第74回全国大会イベント企画 を仕事をしながら聞いていた.

2011/03/09 ふつうに仕事した.

はてブのfeedの購読をやめて, 家では はてブとNaverはブラウザでブロックして見ないようにした.

はてダは書いている知人がいるし, NHN に範囲を広げるとこのブログも引っ越さないといけないし, ということでとりあえず上の範囲にした.

NHN や Livedoorは去年面接に行ったけど Naver は合わないだろうなと思って行かなかった.

2012/03/07 Anuenue 0.7.2 リリース (build.xml 変えただけ)

2012/03/07 anuenue-wrapper - A Search Package with Apache Solr 0.7.2 をリリースしました. テストが ja_JP.UTF-8 ロケールでないと上手く動かないので, build.xml 内で ja_JP.UTF-8 ロケールを強制するようにしました.

ゲームプログラマのためのC++ を読了. ふつうだった.

2012/03/03 サッカー 2012/03/04 サッカー 2012/03/05 SICP 2012/03/06 サッカー

2012/03/03 サッカーの練習試合. 1-2で負けた. 11人しかいなかったので全員フル出場.

2012/03/04 サッカーの公式戦. 1-2で負けた. 前半のみで交代. 試合前に副審.

2012/03/05 SICP読書会. 社外の人がずいぶん増えてきた. 反省会も好評開催中.

2012/03/06 サッカーの練習. 気温が高かったのでいい汗をかいた.

Anuenue 0.5.2 をリリース. http://chasen.aist-nara.ac.jp/stable/ipadic/ がなくなっていたので ipadic が取得できなくなっていた. いま見たら http://chasen.naist.jp/stable/ipadic/ にはあった. ipadic も同梱して配ってしまうものを 0.5.2 とした.

0.5.2 は0.7.1 にくらべるといろいろいけてないので 0.5 系をすでに利用している人以外は利用する必要がありません.

2012/02/28 飲んだ 2012/02/29 ICPA祭り 2012/03/01 サッカー 2012/03/02 Solrをいじる

2012/02/28 飲んだ.

2012/02/29 ICPA祭りがあった. 春山 征吾のくけー : ICPAのエージェントからまたLinkedInで接触されたので厚生労働省の需給調整事業関係業務担当窓口に電話してみた - livedoor Blog(ブログ) を書いているころに, ICPAのエージェントの1人の Twitter アカウントから日本の技術者100人単位に同じ内容のメンションが飛んでいた(魚拓とっておけばよかった). 私には来ていなかった.

非公式RTによって文面は残っている.

おそらく多くの人が spam として報告したために該当のアカウントは Account Suspended になっている.

今回はTwitterだから目立ったが, これ以外にも彼らは複数人で LinkedIn や GitHub, 電話などで絨毯爆撃をしている. 私は電話をすぐ切ったので経験はないのだが, 知り合いの複数人が電話で人生について説教めいたことを言われたといっている.

以下の2005年の記事だと ICPAはそう悪い印象を与えなかったようだ. このころからブログを書いている技術者へのアタックはしていたということで, それがある程度成功したからその路線が拡大したのかもしれない.

今回の件で ICPAがうざいことは大分知られたと思うので, 転職希望者が情弱か会社が情弱でないともはや成立しないのではないか? まあ私にはどうでもよいことだが.

私は職業紹介事業者やそのエージェントを否定する気はないし, 少しは付き合いもある. でもうっとうしいやり方には反対だし拒絶する.

2012/03/01 サッカーした. 木曜は19時まで会議があるが会社出てすぐにタクシーに乗ればそれほどロスせずに練習に参加できることがわかった. なかなかファーストタッチでどこにボール置くかの判断がうまくいかないしミスパスが減らない.

2012/03/02 Solrをいろいろいじった. 非常にたくさんのパターンのあるfield のファセットを取ろうとするとメモリをたくさんつかってしまう. クエリで制限しても全インデックスから可能性を抽出しているようにみえる(すくなくとも facet.method=enum の場合は). こういう場合はSolrからデータをとってきてから分析したほうがよさそうだ.

QRコード
QRコード
  • ライブドアブログ