読者です 読者をやめる 読者になる 読者になる

Hyper-Восток

ずるずると進学した大学院生が自然言語処理について。

20170324

今日は午後からバイトに行ってきた。 上司と1on1があり、GANの議論でちょっと盛り上がる。 今のタスクは画像収集で、シコシコとスクレイピング用コードを書いていた。 たまにすると楽しい。 語彙意味論の教科書は順調に読み進められている。 こういう本は複…

20170320

今日は語彙意味論の教科書の最初の方を読んでからネーム。 久々に言語学の本というか、そもそも専門分野に近い教科書を読むということで、 割と新鮮味のある勉強だった。 英語の本を後で見返すのは大変なので、レジュメっぽくまとめようと試みているが、 あ…

20170318

かなり投稿をサボってしまった。 今週は学会行ったり、学会のレビュー見て次の方向性考えたり、 K談社でパーティーやったりして、色々あったし色んな人にあった。 まあなんだかんだステップアップしている気はするので、 次年度も頑張ろうと思った(雑)。

20170309

今日はバイトだった。研究のアイデアが生まれたのでよかった。 ここしばらくはある論文の実装とトライアンドエラーをずっとやっているが、 実装している内に論文の理解が進むし、そこで生じる違和感とかは大事にして、 じっくり考えた方がいいんだろうな。 …

20170308

今日は言語処理学会に向けた発表練習があり、発表資料作りのために徹夜してしまった。アホか。 会場はVGAしかないらしいので、macとVGA繋ぐアダプターを買っておかないとな。 ノートPCの買い替えのスパンと、プロジェクターの買い替えのスパンが違うので、 m…

20170304

この3日間は色々サボって、ゲーム・オブ・スローンズをイッキ見したり、 先輩に遠くの二郎系ラーメンに連れて行ってもらったりしていた。 まあ春休みということで…。 明日からがんばろ。

20170301

2月中を目標にしてたモデルの実装が一段落ついたので、数学の勉強を再開した。 とりあえず放置していた微積分の教科書の最後の数章を終わらせた。 iPad Proをノートがわりにすると便利。 あとはアニメを少し見て、ネームを少し進めた。 学会までには完成させ…

20170227

今日は実装したモデルのデバッグをしたかったためバイトを入れた。 研究しながら小銭を稼げるのでいい感じだ。 今月中にちゃんと動かせるかわからなかったのだが、 落ち着いてコードを見直して不備を直しつつ、 Optimizerを変えるなどして、ひとまずちゃんと…

20170226

今日はアニメをたくさんみて、ほぼオフにしてしまった。 創作の方はちょっと進めてしまったが。 週末にほぼ何もやらないというのは久々だったため、 なかなか新鮮な気分だった。 やはりこういう日を週に1日設けるのは基本なのかもしれない。 その分平日に頑…

20170224

今日は論文を一つ読んで、 あとはipad proでずっと絵を描いていた。 だいぶこなれてきた感じがある。 下描き〜ペン入れは、正直ipad pro+procreateの方がやりやすいという感じになってきた。 ツールウィンドウとかレイヤーウィンドウとかがなく、 使いたい時…

20170222

昨日のコーディングがわりとうまくいったので、今日はオフにして、 一日iPad Proで絵を描いたりしていた。 研究フリーの日だからといって論文を読まなくていいわけではないのだが…、まあたまにはね。iPad Pro、衝動買いチックに購入してしまったが、 結果的…

20170222

今日はモデル実装がやりたかったのでバイト先へ行った。 hinge rank lossを実装したかったのだが、tensorflowにはないので、 結局hinge rank loss計算用のミニバッチ化まではtensorflowの外でやって、 それ以降の計算をtensorflowでやることにした。 一応コ…

20170220

今日は朝から映画を見ようと思ったのだが、昨晩夜更かししてしまったので、 諦めて朝はゆっくり寝ていた。 起きてからtensorflowの勉強をした。 なんとなくモデルの実装の目処はたったので、今週中にはちゃんと実装して、 さっさと実験したい。 夕方は劇場版…

20170219

今日は友人二人とファミレスに居座り、ずっと作業をしていた。 ひとりは小説を書き、ひとりは小説と哲学書を読み、 俺はキャラクターデザインをやっていた。 日曜は研究フリーの日にしようと思っていたのだが、 今朝はgensimからword embeddingを読み込み、t…

20170218

今日は早く起きすぎたせいか、 午前中に「けものフレンズ」とかを観てダラダラしたのに、 午後は寝てしまった。 夜は煮干しラーメンを食べに行ってから論文をひとつ読んだ。 やりたい実装があるのだが、どうもtensorflowの勝手がわかっておらず、難儀してい…

20170216

今日はバイト。 tensorflowでの画像処理の勉強をしてた。 tensorflowがv1.0にアップデートされ、メンターの人のテンションがちょっと高めだった。 どうアップデートされたのかは知らないのだが、とりあえず書くのが簡単になってるといいな。 でもtf.kerasが…

20170213

今日は新しく研究用に買ってもらったマシンのセットアップだった。 置き場所作りとOSのインストールから、tensorflowがGTX-1080を認識してくれるようにするまで。 入れたubuntuが16.10だったため、kernel driverと合ったlibcuda1-*が自動的に入らず、手動で…

20170212

午前中は移動中に線形代数の勉強をした。 教科書は「ストラング線形代数イントロダクション」。 移動中に読んだだけなので、豊富な練習問題が解けてない。 あとは昼寝をして、絵の練習をして論文を1つ読んだ。 明日は指導教官とマシンのセットアップをする…

WORD REPRESENTATIONS VIA GAUSSIAN EMBEDDING

概要 単語の表現をベクトル(点)ではなく、ガウス分布として獲得する手法を提案した論文。 従来手法との比較 従来の点で表現する手法は、ターゲットとするコンセプトのuncertaintyが表現できない。 ベクトル同士は内積もしくは余弦類似度で比較されるが、非…

Multi-Prototype Vector-Space Models of Word Meaning

http://aclweb.org/anthology/N/N10/N10-1013.pdf 単語ベクトルの欠点である多義性に対応するために、表層系、基本形ごとに単語ベクトルを作るのではなく、単語の意味ごとにベクトルを作る。 具体的には、ターゲット語と共起した文脈語のベクトルをクラスタ…

Item2Vec Neural Item Embedding for Collaborative Filtering

[1603.04259] Item2Vec: Neural Item Embedding for Collaborative Filtering バスケット分析などに使うため、同じカートに入った商品を文脈にして、 対象の商品を予測するようにNNを学習し、商品をベクトル化。 これにを用いて類似商品間の類似度を測り、レ…

Exploiting Image Generality for Lexical Entailment Detection

http://aclweb.org/anthology/P/P15/P15-2020.pdf 単語ベクトルを用いるのではなく、画像を利用して語のgeneralityを測ったアプローチの論文。 対象の単語をグーグル画像検索に入力し、そこにある画像のバリエーションから、その単語のgeneralityを評価する。…

ACL執筆中

結局ぜんぜん更新できてない…。 ACL2017投稿用にまとめている。 初の英語論文なので難儀難儀。 来年はちゃんと機械学習の勉強しつつ、語のrepresentationについてちゃんと検討できると良いな。

ブログ開設

自分の研究分野(自然言語処理、特に語の意味について)の日々のサーベイなどをまとめておくために開設しました。 飽きずにどこまで書けるか。