毎日、何百ものニュースが、人間ではなくコンピューターによって作成される。この自動ジャーナリズムは、なんと5年以内にピューリッツァー賞を受賞することを狙っている!? PHOTO BY thomasheylen / Flickr ナード向けガジェットサイト「Thinkgeek」では、「あっちへ行け。お... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
プログラミング, 自然言語処理はじめに大規模なテキストデータでのN-gram統計を取る場合、特にNが大きい場合(N>=3)は、組み合わせの数が多くなり出てくるN-gramをすべてメモリに保持しながら個数をカウントするのが難しい。効率的な方法があるのを知ったのでちょっと試してみた。 大規模テキストに... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
昨年8月、Gmailは優先トレイ(Priority Inbox)を発表した。この機能はメール洪水をさばくのに非常に有効だと判明している。メールの重要性を自動的に判断して優先トレイに表示するこの機能はまだ完全とはいえないが、ユーザーが受信トレイを眺める時間を平均15%も削減したといわれる。「優先トレ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Loading…Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here.... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
前の記事 1月12日は『HAL 9000』の誕生日人間の「クイズ王」と対戦、IBMの『Watson』(動画)2011年1月14日ITコメント:トラックバック (0)フィードITSam Gustin米IBM社は12月中旬、同社のコンピューター『Watson』が米国の人気クイズ番組『Jeopardy!... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
自然言語処理 | 15:47 | WindowsでMeCab Pythonを使う(2010/11/21)のつづきです。形態素解析を使ってると単語が変なところで切れていたり、未知語が多かったりと不満点が出てきます。また、応用によっては、形態素ではなく、複合語単位で抽出したいということもしばしばありま... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
前の記事 「ブログの時代は終わった」か:米調査500万冊のGoogleデータで「文化の進化」を分析2010年12月21日社会メディアコメント:トラックバック (0)フィード社会メディアBrandon Keim19〜20世紀の書籍における、西洋の著名思想家(ガリレオ、ダーウィン、フロイト、アインシュ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
このページはチュートリアルなどで作った発表資料で、今のところは主に研究室の修士の学生に発表したものです。他にも参考になるかもしれませんので、公会しておきます。ちなみに、チュートリアルをするのが好きなので、これらのスライドを発表してもらいたいという方がいれば発表依頼は大歓迎です!ノンパラメトリックベ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。 現在の機能 かな漢字変換 予測変換 または サジェスト スペル訂正 形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、Sta... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
すみません。タイトルはやや釣り気味です。類似検索エンジンというか、そのアイデア程度の話なんですが、以前から考えていた類似検索エンジン風のネタがあったので、ちょっとperlで書いてみたので、そいつを晒してみます。Luigi https://github.com/miki/Luigi類似検索なので... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。タイトルは釣りじゃない。その理由を10個挙げる。自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎるボリュームがあるのに書き方が平易でついつい読みふけってしまう演習問題があり,自... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ソフトウェア , ニュースコピペするなー、コピペルナー!掲載日時:2010.01.12 16:00 コメント [0], トラックバック [0]本当にすみません。度重なるコピペレポートに業を煮やした杉光教授が開発したのは、コピペ文書を発見する「コピペルナー」。Wikipediaやブログ、文献データ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ネットスラングもたちどころに入力出来る柔軟性が売りのGoogle日本語入力。「ただしい」と入力すると、即座に「ただしイケメンに限る」が表示されるグーグルには、勤務時間の20%を自由な企画・開発に当てていい「20%プロジェクト」という制度がある。Google検索での誤入力に対して、正しい検索キーワー... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
==ネタ編== まだ書こうとするものがはっきりと見えて来ない段階や、曖昧模糊とした「原初のスープ」にスパイスの一撃を加えたい時など、探してみて見るとよい検索たちです。 ■物語要素事典 古典、民話から小説、映画や漫画に至るまでを対象に、物語のパーツとなる「物語要素」(物語素)を拾い出し、分類、... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ニュース「Google日本語入力」開発者が語る、その狙い大きな反響を呼んでいる「Google日本語入力」。そこには「IMEはWebアプリケーションの重要なコンポーネントの1つだ」というWeb企業・Googleらしい認識と理想が込められている。開発者が狙いを語った。2009年12月07日 20時47... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
音声認識サービスを提供しているカタログは11月24日、声で入力するiPhone用Twitterアプリ「しゃべったー」を公開した。利用料金は無料だ。アプリを起動して声を録音すると、アプリが音声の特徴点を抽出してサーバに送信し、サーバ側で文字に変換した上で表示する。変換結果が意図と違う場合は、手作業で... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
使用するリソースファイルを指定する リソースファイルとは、辞書ディレクトリに入っている「dicrc」ファイルを指します。 試しにシステム辞書の「dicrc」ファイルをコピーして、「dicrc2」というファイルを作り、その中の「; simple」の「EOS」を「eos」に書き換えます。するとこんな風... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
学校文法では、「文は主語と述語によって成り立つ」と教わる・・・という文には主語がない。こういう場合、学校では「生徒は」という主語が「省略されている」と教わるが、この基準で日本語の日常会話を分析すると、90%以上の文で主語は「省略」されている。世界の他の言語をみても同じで、主語が不可欠なのはインド=... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 マルコフ連鎖を利用して文章を要約、もしくは意味不明にしてくれるのが「マルコフ連鎖ジェネレーター」というわけです。 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
かの有名な検索エンジン「Google」にはページランクという概念がありますが、そのページランクを支える理論の一つがこの「マルコフ連鎖」というもの。さまざまなジャンルに応用されていることでも有名で、人工知能ならぬ「人工無能(いわゆるチャットボット、会話ボットなど)」にも使われることがあります。 で、... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|