タグ別アーカイブ: グーグル

中国語の発音を覚えるためのGoogle Chrome拡張機能

中国語の四声をなかなか覚えられないので、Google Chromeで強制的に覚えることにした。利用するのは下記の3つのファイル。
Google Chrome 拡張機能:Mouseover Dictionary Framework
Google Chrome 拡張機能:中英辞典(CC-CEDICT)
CC-CEDICT辞書データファイル
Google Chromeを起動し、上の2つの拡張機能をこの順番にインストールする。そして3つ目の辞書ファイルを、マイドキュメントなど適当なフォルダで解凍して、Google Chromeを再起動する。
しばらく待つと、どのようにかは定かでないが、Google Chromeの拡張機能「中英辞典」が自動的に辞書データファイルを認識する。
他に「Bubble Translate」など、Google Chrome上でマウスで範囲指定するだけで翻訳してくれる拡張機能が、すでにインストールされている場合は、それらは無効にする。
以上でインストールは終わり。あとは「中英辞典」のオプションで、翻訳バブルウィンドウの背景色・文字色などを好みの色に変更するだけ。
すると、日本語のウェブページであっても、漢字の上にマウスポインタを乗せるだけで、その漢字の四声アクセント記号つきピンインが、英訳とともにバブルウィンドウで表示される。嫌でも表示される。どうしても邪魔な場合は、いちいち[Ctrl]+[Z]で解除する必要がある。
これでいい加減、四声も覚えるだろう。本当は勝手に発音してくれるといちばん良いんだけど。
普段、Googleピンイン入力で中国語を入力しているので、四声抜きのピンインはかなり覚えてきたんだけれど、四声はこうでもしないと覚えれらない。
以上、Google Chromeユーザーのための中国語の四声の暗記法でした。

百度の日本語入力システム、やめました

ごめんなさい。百度の日本語入力システム Baidu Type を、使用3日目にしてグーグル日本語入力システムに戻しました。
その理由は、連文節変換の精度があまりに悪いからです。
長いフレーズを一気に変換したときに、とんでもない漢字に変換される可能性が高いんです。
例えば「かきはたんなるいちれいです」を一気に変換すると、
百度:「書きは単なる一霊です」
Google:「下記は単なる一例です」
MS IME:「書きは単なる一例です」
こうなります。百度の連文節変換が、いかにひどいかがよく分かります。というのは「一霊」などという日本語がそもそも存在しないからです。
おそらく百度の辞書は、日本語の単位(中国語文法風に言えば量詞)をまともに変換できていません。
例えば、薬の1錠の「錠」も、百度では数字といっしょに「いちじょう」で変換しようとすると、変換候補にさえ出てこないからです。当然、グーグルやマイクロソフトでは変換候補にちゃんと出てきます。
他の例では「かれのしょじょさくはこうひょうをはくした」を一気に変換すると、
百度:「彼の処女作は公表を博した」
Google:「彼の処女作は好評を博した」
MS IME:「彼の処女作は好評を博した」
百度だけが「好評を博する」という成句を変換出来ていません。おそらく百度の日本語辞書はグーグルやマイクロソフトと比較して、根本的に弱いと思われます。
また別の例で、「いじょうのてんは」という簡単な変換でも、百度の場合は学習させない限り「以上の店は」が第一候補になります。
この例では、百度の漢字変換ロジックが、日本語の漢字の音読みと訓読みの用法の違いを軽視していると推測されます。
といっても、まだ、百度の日本語入力システムはベータ版です。正規版になったときには、これらの基本的な問題が解決されていることを期待しています。

さっそく百度の開発チームから感謝メール!

百度の日本語入力システム「Baidu Type」を紹介したら、さっそく百度の開発チームの方から感謝のメールを頂いた。
これこそ、グーグルと百度の違いである。
この「愛と苦悩の日記」の親サイトである「think or die」が「AdSense八分」にあったとき、グーグル社からは何の説明もなかった。
また、いま個人的に作成中の実験的なブログが、いつの間にかグーグルのインデックスから削除されたのだが、それについてもグーグル社から何の説明もない。
※ちなみにビデオニュース・ドット・コムも「AdSense八分」にされたウェブサイトの1つである。
先の記事で「パソナキャリア 評判」を例として説明したように、検索エンジン最適化を各企業が乱用したせいで、すでにグーグルのページランクは当てにならない。
また、グーグルの検索結果に含めるかどうかは、グーグル社が恣意的に決めているので、グーグルのウェブ検索自体もどこまで信頼できるか分らない。
事実、Yahoo!JAPANと百度(日本語)のブログ検索結果には出てくるが、グーグルのウェブ検索結果には出てこないブログが存在する。
もちろん中華人民共和国の政府によるネット検閲は許されないことだが、別の原則に基づいて実際に検閲を行っているグーグルに、それを非難する資格は全くない。

百度(Baidu)の日本語入力システムがすごい!

中国大陸の検索サイト「百度」が、日本語入力システムのベータ版を公開している。以下のリンクからダウンロードしてインストールできる。
「Baidu Type – 文字入力システム」
この文章もBaidu Typeで入力しているのだが、グーグルの日本語入力システムといい勝負をしている。
マイクロソフトのMS IMEは、ご承知のように日本の芸能人や地名などの固有名詞は全く変換候補に出て来ないが、グーグルと百度の日本語入力システムでは出てくる。
グーグルの日本語入力システムの売りは、かなの入力中に変換候補が表示された時点で、[Tab]キーを押すだけで、残りを自動で決定してくれるスピーディーな予測変換機能だ。これでかなり入力が高速になる。
しかし百度のBaidu Typeにもすごい機能がある。入力モードが2種類あるのだ。
一つは[Space]キーで変換候補を選択してから、[Enter]キーで確定するという、MS IMEやグーグル日本語入力システムと同じ二段階変換のモード。
もう一つの入力モードが画期的で、[Space]キー、または数字キーのどちらかだけで、[Enter]キーを押さなくても確定される一発変換モード。キーストロークが1回減るのだ。
この一発変換モードに慣れた後に、二段階変換モードにもどると、いちいち二段階で確定しなければならなのがもどかしくなる。
百度のBaidu Typeのグーグル日本語入力に対する優位点はもう1つある。
一つは顔文字変換。たとえば「あせ」と入力すると、:(;゙゚’ω゚’):こういう複雑な顔文字まで候補の中に出てくる。
他にも「ごめん」と入力すると _(._.)_ や _(_^_)_ 「なみだ」と入力すると (つд⊂) や (´;ω;`) 「いかり」と入力すると (-_-メ) や ヽ(`Д´)ノ が候補に出てくる。これは笑える。
ここまで来ると、もうマイクロソフトのMS IME 2007には戻れないだろう。
ブログを書いていると、どうしても日本国内の著名人の名前や、地名を入力する必要がある。
マイクロソフトのMS IMEでは、固有名詞を何度も入力する場合、ユーザー辞書に登録する必要があるが、グーグル日本語入力と百度のBaidu Typeでは、全くと言っていいほどその必要がない。
以下、マイクロソフトのMS IMEでは絶対に一発で変換できないが、グーグル日本語入力と百度のBaidu Typeでは一発で変換できる事例だ。事例に特に意味はない。単に思いついた人名・地名を適当に入力しただけだ。
東国原知事
錦野旦
平野綾
越谷レイクタウン
やはり、固有名詞の予測変換はグーグル日本語入力の方が圧倒的に便利だ。予測変換の候補が表示されるタイミングが早いし、候補が複数表示される。
上記の「東国原知事」の場合、Baidu Typeは「東国原知事」しか出てこないが、グーグル日本語入力なら、「ひがしこ」まで入力した時点で「東国原知事」「東国原英夫」「東小金井」「東高円寺」なども表示される。
いずれにせよ、もうマイクロソフトのMS IMEは使い物にならない。
最後に、百度のBaidu Typeには「スキン変更」というおちゃめな機能がある。
以下、いくつかのスキンを使って、日本語入力している途中の画面をキャプチャしてみた。何だか、とっても楽しい。
Baidutypesample001
Baidutypesample002
Baidutypesample003

Google has no right to criticize Chinese government censorship

グーグルが中国から撤退するかどうかという問題について、クリントン米国務長官までグーグルの援軍をしている。
Regarding the problem between Google and China, even Hillary Clinton supports Google and criticizes Chinese government.
しかし、グーグルのどこが自由を尊重する会社なのだろうか?僕にはさっぱり分からない。
BTW, I can’t understand why Google has the right to criticize Chinese government.
というのは、グーグルも堂々と検閲を行っているからだ。
That’s because we Japanese know Google does censor web sites in their own way.
例の「グーグル八分」というやつである。
In Japan, such kind of Google’s censorship is very notorious and we call it ‘Google Hachibu’. ‘Hachibu’ is the tradition of pre-modern Japanese society which casts out some inhabitants based on various reasons.
ご承知のように、グーグルのページランクの仕組みを利用して、検索順位を上げるテクニックを「検索エンジン最適化(SEO)」という。
As you know, SEO means making page rank better, taking advantage of the program logic of Google page rank.
企業各社は、ときに専門のコンサルタントにお金を払ってまで、グーグルの検索順位を上げるための「検索エンジン最適化」を行っている。
Every company does this kind of SEO. Some comapnies even pay considerable amount of money to SEO consultants.
しかし、それを「やり過ぎる」と、グーグルの検索結果に出て来なくなってしまう。これがSEOに基づく「グーグル八分」だ。
However, if the SEO goes beyond ‘some’ boundary, the web site will be deleted from Google’s index. This is ‘Google Hachibu’ based on SEO.
もう一種類の「グーグル八分」は、有名な「AdSense」という広告表示サービスに基づくものだ。
The other kind of ‘Google Hachibu’ is based on the sevice called AdSense.
「AdSense」とは、自分の運営するウェブサイトに、グーグルが自動的に提供する広告を表示して、その広告から収入が得られるというサービスだ。
I think I don’t need to explain what is ‘AdSense’.
この「AdSense」を掲載するには、申請が必要で、まずその時点でサイトの内容に「検閲」が入る。さらに、申請に合格して、広告が表示され始めた後でも、いきなりグーグルが「AdSense」を一方的に打ち切る場合がある。
To insert ‘AdSense’ to our own web sites, we have to apply and go under Google’s censorship of the contents of web sites in advance. In addition, even after going through Google’s censorship, some web sites can be suddenly deleted from AdSense accounts.
SEOの「グーグル八分」は、技術にもとづく「検閲」であり、AdSenseの「グーグル八分」は、言論の内容にもとづく「検閲」である。
SEO is a Google’s censorship based on technology. AdSense is a Google’s censorship based on the contents of web sites.
まずSEOの「グーグル八分」だが、ページランクの技術的な仕組みを活用したSEOが、どこまでいくと「やり過ぎ」で「グーグル八分」にされるのか、その基準はグーグルが勝手に決めている。
First, regarding SEO, the boundary where a web sites is deleted from Google’s index is not so clear and defined by Google in an arbitrary manner.
このやり方はフェアではない。
This way of doing things is not fair.
ページランクという技術の「乱用」に対向するなら、グーグルの検索結果から削除する(=グーグルインデックスから削除する)という方法ではなく、ページランクの技術自体を改善することで対向するのが、フェアなやり方である。
If Google wants to defend themselves against the abuse of page rank system, they should improve their page rank system instead of deleting the web sites based on the arbitrary rules. The abuse of technology shoule be overcome by the improvement of technology. This is the fair way of defending themselves against the abuse of page rank.
次にAdSenseの「グーグル八分」だが、こちらは明らかに内容に基づく検閲である。
Secondly, ‘Google Hachibu’ of AdSense is clearly Google’s censorship based on the contents of web sites.
そんなグーグルが中国の検閲を批判しても、米国以外では何の説得力もないのだが、米国のみなさんは全くそういう状況を理解していないだろう。
All the wired nations other than the US know that Google does such kinds of censorship. So Google’s criticism against Chinese government censorship isn’t persuasive at all outside of the US. However, people in the US don’t seem to understand this situation.
I’m afraid that my blog might be deleted from Google’s index because of this entry. This is not a joke. I’m serious.