外国語を書くのに、すべて丸投げしておまかせできるウェブサービスは存在しない。 有料で、向こうにちゃんと翻訳できる人がいる場合でもできるのは、〈外国語で書く〉という問題解決を支援することである。 複数の情報源(ソース)から得られたものを突き合せて信頼性を高めるのが情報に関する問題解決の基本ス... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
英辞郎は、1980年代にある翻訳家(匿名希望)が個人の英単語用例集として始められ、その後結成されたEDP(Electronic Dictionary Project)によって長年共同編纂が続けられている「成長する辞書」である。 正確性は報奨されないものの、2012年04月時点で、英和見出項目数 ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
「国会図書館サーチ」正式公開、全国図書館や民間の電子書籍も検索可能 国立国会図書館や全国の公立図書館、電子書籍サイトなどの文献情報が検索できるサービス「国立国会図書館サーチ(NDL Search)」が1月6日、正式公開された。 検索対象となっているのは国会図書館、都道府県立図書館、国立情報学研究所... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
プログラミング, 自然言語処理はじめに大規模なテキストデータでのN-gram統計を取る場合、特にNが大きい場合(N>=3)は、組み合わせの数が多くなり出てくるN-gramをすべてメモリに保持しながら個数をカウントするのが難しい。効率的な方法があるのを知ったのでちょっと試してみた。 大規模テキストに... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Googleに負けないものを作りたい――女子大生が挑む日本独自の「かわいい検索」 女の子の“かわいい”を検索できる「かわいい検索」は、アルゴリズムの設計からプログラミング、デザインまで、学生が中心になって作り上げたWebアプリ。Googleが無視している「Webページの見た目の雰囲気」という要素に... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
上手に反論する方法 11/05/23 Comment(0) Trackback(0) 上手に反論する方法 他人と上手くコミュニケーションをとるには、どうしたらよいのだろう?と思い始め、調べているうちにある「考え方」にたどり着きました。 心の動きが手にとるようにわかるNLP理論 とても奥が深い考え方... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
IBMの科学者25人が4年がかりで開発、200万ページを3秒以内にスキャンする威力で2億ページ分の文章(100万冊の本に相当)を取り込み、15テラバイトのメモリ・2880個のCPUを積んでLinux搭載の「IBM POWER 750」サーバ10ラック分(大きさは冷蔵庫10台分程度)、1秒間に80兆... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
Loading…Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here.... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
他言語を使う人と話をするとなると、通訳や辞書などが必要になるというのが昔からの常識だった。こうした方法はいずれにせよお金もかかるし面倒でもあった。しかしインターネットの登場により、この障壁はずいぶん低いものとはなった。もちろんコンピュータと首っ引きになっている必要はあったが、進歩したのは間違いない... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
自然言語処理 | 15:47 | WindowsでMeCab Pythonを使う(2010/11/21)のつづきです。形態素解析を使ってると単語が変なところで切れていたり、未知語が多かったりと不満点が出てきます。また、応用によっては、形態素ではなく、複合語単位で抽出したいということもしばしばありま... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
前の記事 「ブログの時代は終わった」か:米調査500万冊のGoogleデータで「文化の進化」を分析2010年12月21日社会メディアコメント:トラックバック (0)フィード社会メディアBrandon Keim19〜20世紀の書籍における、西洋の著名思想家(ガリレオ、ダーウィン、フロイト、アインシュ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
このページはチュートリアルなどで作った発表資料で、今のところは主に研究室の修士の学生に発表したものです。他にも参考になるかもしれませんので、公会しておきます。ちなみに、チュートリアルをするのが好きなので、これらのスライドを発表してもらいたいという方がいれば発表依頼は大歓迎です!ノンパラメトリックベ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。 現在の機能 かな漢字変換 予測変換 または サジェスト スペル訂正 形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、Sta... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
すみません。タイトルはやや釣り気味です。類似検索エンジンというか、そのアイデア程度の話なんですが、以前から考えていた類似検索エンジン風のネタがあったので、ちょっとperlで書いてみたので、そいつを晒してみます。Luigi https://github.com/miki/Luigi類似検索なので... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。タイトルは釣りじゃない。その理由を10個挙げる。自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎるボリュームがあるのに書き方が平易でついつい読みふけってしまう演習問題があり,自... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
前の記事 台所で生じる「ホワイトホール」:物理学者が検証Twitterで株式市場を予測:「86.7%の精度」2010年10月22日サイエンス・テクノロジーコメント:トラックバック (0)フィードサイエンス・テクノロジーLisa GrossmanImage: flickr/Perpetualtour... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ちなみに、上で紹介した identicon の Python 実装にはバグがあります. decode() 関数は以下のようになるべきです。def decode(self, code): # decode the code middleType = self.MIDDLE_PATCH_SET[cod... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ニュース「Google日本語入力」開発者が語る、その狙い大きな反響を呼んでいる「Google日本語入力」。そこには「IMEはWebアプリケーションの重要なコンポーネントの1つだ」というWeb企業・Googleらしい認識と理想が込められている。開発者が狙いを語った。2009年12月07日 20時47... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
12月3日に話題騒然となったGoogleによるIME、「Google 日本語入力」。忽然と現れたベータにも関わらず、その性能が従来に無く専門用語や固有名詞に強いということで評判です。そして、日本語IMEと言えば、みなさん思う浮かべるジャストシステム社への影響を心配する声が出ています。MS-DOS時... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 なんだかよくわからなかったので「部屋」と「私」と入れてみた。第一候補がシャツだった。ちょっと惜しい。 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|