Blog
2005/10/04のBlog
[ 16:04 ]
[ 検索エンジン ]
新しいYahoo検索での検索結果順位の傾向を調べてみた。
管理しているネットショップサイトで最も力を入れている(複合)キーワードでの検索結果順位が、Yahoo、Google, MSNでどう違うかを調べたもの。(圏外は、30位以下)
_______Yahoo____Google________MSN
-----------------------------
A_______1__________7________________圏外
B_______2__________圏外___________圏外
C_______3__________10______________1
D_______4__________圏外___________圏外
E_______5__________3________________圏外
F_______6__________8________________8
G_______7__________圏外___________圏外
H_______8___________23_____________圏外
I________9__________圏外___________圏外
J______10__________22_____________圏外
K______11_________圏外___________圏外
L______12__________圏外__________圏外
M_____13__________圏外__________圏外
N_____14__________圏外___________圏外
O_____15__________圏外___________圏外
P_____16__________圏外___________圏外
Q_____17__________圏外___________圏外
R_____18___________4_______________15
S_____19__________圏外___________6
T_____20__________圏外__________圏外
------------------------------
(表は、例えば、Yahooで1位のAサイトは、Googleでは7位、MSNでは、30位以下という意味)
それぞれの検索エンジンで、順位付けアルゴリズムの違いを反映して、かなりの違いがある。Google上位(10位以内)でYahooでも上位になっているものは、4つ。MSNでは、2つ。
すべての検索エンジンで上位なのは、CとFの2サイトのみであり、難しいことがこの表からもわかる。Yahoo 6位のサイトFは、Google, MSNでも8位と安定して順位を確保している。注目サイトだ。研究せねば。
Yahoo3位のサイトCは、実はわが管理サイト。昨日は2位だったが、3位に落ちた。Googleでは、昨日11位が今日は10位と1ページ目に戻ってきた。。。。が冴えない。Goolgeで5位まで上がったことがあるが、ベスト3には、なかなか食い込めない。
上の表からYahooは、独自の特色ある検索結果を出しているようなので、その中身を調べてみた。次の表は、検索結果順位20位までのサイトの形態。Google, MSNでのそれと比較してみた。
________________Yahoo_______________________ Google___________MSN
----------------------------------------------
1______________ショップ______________________ショップ__________ショップ
2______________ アフィリエイト______________その他___________その他
3______________ ショップ______________________ショップ__________ショップ
4______________ ブログ________________________ショップ__________ショップ
5______________ ショップ______________________その他___________ショップ
6______________ ショップ______________________ショップ__________ショップ
7______________ ショップ______________________ショップ__________ショップ
8______________ その他_______________________ショップ__________ショップ
9______________ その他_______________________ショップ__________ショップ
10____________ ショップ______________________ショップ__________ショップ
11____________ ショップ______________________その他___________その他
12____________ その他_______________________ショップ__________その他
13____________ アフィリエイト_______________ショップ__________ショップ
14____________ ショップ______________________ショップ__________ショップ
15____________ アフィリエイト_______________その他___________ショップ
16____________ アフィリエイト_______________その他___________ショップ
17____________ ショップ______________________ショップ___________ショップ
18____________ ショップ______________________ショップ___________ショップ
19____________ ショップ______________________ショップ___________ショップ
20____________ ショップ______________________その他__________ショップ
----------------------------------------------
これから、わかることは、Yahooは、アフィリエイトがかなり上位に食い込んでいる。ブログも入っている。
これは、キーワードによって違うだろうから一般化はできないが、Yahooでは、アフィリエイトやブログで上位を狙うことが可能なようだ。逆に、GoogleやMSNでは、アフィリエイトの出る幕はない、ように見える。
わが管理ショップサイトへの昨日のYahooからのアクセスは、それまでの40%増しだった。倍、数倍とまではいかなかったが、増えたことは、単純に嬉しい。
管理しているネットショップサイトで最も力を入れている(複合)キーワードでの検索結果順位が、Yahoo、Google, MSNでどう違うかを調べたもの。(圏外は、30位以下)
_______Yahoo____Google________MSN
-----------------------------
A_______1__________7________________圏外
B_______2__________圏外___________圏外
C_______3__________10______________1
D_______4__________圏外___________圏外
E_______5__________3________________圏外
F_______6__________8________________8
G_______7__________圏外___________圏外
H_______8___________23_____________圏外
I________9__________圏外___________圏外
J______10__________22_____________圏外
K______11_________圏外___________圏外
L______12__________圏外__________圏外
M_____13__________圏外__________圏外
N_____14__________圏外___________圏外
O_____15__________圏外___________圏外
P_____16__________圏外___________圏外
Q_____17__________圏外___________圏外
R_____18___________4_______________15
S_____19__________圏外___________6
T_____20__________圏外__________圏外
------------------------------
(表は、例えば、Yahooで1位のAサイトは、Googleでは7位、MSNでは、30位以下という意味)
それぞれの検索エンジンで、順位付けアルゴリズムの違いを反映して、かなりの違いがある。Google上位(10位以内)でYahooでも上位になっているものは、4つ。MSNでは、2つ。
すべての検索エンジンで上位なのは、CとFの2サイトのみであり、難しいことがこの表からもわかる。Yahoo 6位のサイトFは、Google, MSNでも8位と安定して順位を確保している。注目サイトだ。研究せねば。
Yahoo3位のサイトCは、実はわが管理サイト。昨日は2位だったが、3位に落ちた。Googleでは、昨日11位が今日は10位と1ページ目に戻ってきた。。。。が冴えない。Goolgeで5位まで上がったことがあるが、ベスト3には、なかなか食い込めない。
上の表からYahooは、独自の特色ある検索結果を出しているようなので、その中身を調べてみた。次の表は、検索結果順位20位までのサイトの形態。Google, MSNでのそれと比較してみた。
________________Yahoo_______________________ Google___________MSN
----------------------------------------------
1______________ショップ______________________ショップ__________ショップ
2______________ アフィリエイト______________その他___________その他
3______________ ショップ______________________ショップ__________ショップ
4______________ ブログ________________________ショップ__________ショップ
5______________ ショップ______________________その他___________ショップ
6______________ ショップ______________________ショップ__________ショップ
7______________ ショップ______________________ショップ__________ショップ
8______________ その他_______________________ショップ__________ショップ
9______________ その他_______________________ショップ__________ショップ
10____________ ショップ______________________ショップ__________ショップ
11____________ ショップ______________________その他___________その他
12____________ その他_______________________ショップ__________その他
13____________ アフィリエイト_______________ショップ__________ショップ
14____________ ショップ______________________ショップ__________ショップ
15____________ アフィリエイト_______________その他___________ショップ
16____________ アフィリエイト_______________その他___________ショップ
17____________ ショップ______________________ショップ___________ショップ
18____________ ショップ______________________ショップ___________ショップ
19____________ ショップ______________________ショップ___________ショップ
20____________ ショップ______________________その他__________ショップ
----------------------------------------------
これから、わかることは、Yahooは、アフィリエイトがかなり上位に食い込んでいる。ブログも入っている。
これは、キーワードによって違うだろうから一般化はできないが、Yahooでは、アフィリエイトやブログで上位を狙うことが可能なようだ。逆に、GoogleやMSNでは、アフィリエイトの出る幕はない、ように見える。
わが管理ショップサイトへの昨日のYahooからのアクセスは、それまでの40%増しだった。倍、数倍とまではいかなかったが、増えたことは、単純に嬉しい。
2005/10/03のBlog
[ 10:45 ]
[ 検索エンジン ]
Yahoo JAPANの検索が、ベータの文字が消えて、新しくなった。
今までは、検索結果がYahoo!カテゴリ優先だったが、リニューアルで以前の[ページとの一致]が表示されるようになった。検索結果の順位付けアルゴリズムも、ベータで実験していたものになり、以前のものとは変わった。
新しく追加された機能として、「関連検索ワード」というのがある。これは、検索したキーワードとよく組み合わせて検索されるキーワードを参考表示するものだ。ユーザにとっては、検索範囲が広すぎて結果に満足できない場合、この「関連検索ワード」で絞込みができる。また、SEO的には、これで検索ワードの適否を判断できる格好の情報になる便利な機能だ。
管理するショップサイトで狙っているあるキーワードが、新しいYahoo検索で、今までの圏外から、約300万中、2位に上がってきた。現在のところYahooからの検索数に大きな変化はないが、これからが楽しみである。
だが、主に重点をおいて対策しているGoogleでは、このキーワードが2ページ目にまで落ちた。とほほ。。。キーワードにもよるだろうが、YahooでもGoogleでも上位というのは難しそうだ。
MSNで1~2位だった単一キーワードは、サイトのコンテンツを修正してから、3ページ目(20位台)にまで落ちてしまった。そのため、このキーワードでのアクセス数が、上位のときの1割くらいにまで落ち込んでいる。ページが変わる毎にアクセス数が1/3づつ落ちるという説があるが、もっと落ちるようだ。
今までは、検索結果がYahoo!カテゴリ優先だったが、リニューアルで以前の[ページとの一致]が表示されるようになった。検索結果の順位付けアルゴリズムも、ベータで実験していたものになり、以前のものとは変わった。
新しく追加された機能として、「関連検索ワード」というのがある。これは、検索したキーワードとよく組み合わせて検索されるキーワードを参考表示するものだ。ユーザにとっては、検索範囲が広すぎて結果に満足できない場合、この「関連検索ワード」で絞込みができる。また、SEO的には、これで検索ワードの適否を判断できる格好の情報になる便利な機能だ。
管理するショップサイトで狙っているあるキーワードが、新しいYahoo検索で、今までの圏外から、約300万中、2位に上がってきた。現在のところYahooからの検索数に大きな変化はないが、これからが楽しみである。
だが、主に重点をおいて対策しているGoogleでは、このキーワードが2ページ目にまで落ちた。とほほ。。。キーワードにもよるだろうが、YahooでもGoogleでも上位というのは難しそうだ。
MSNで1~2位だった単一キーワードは、サイトのコンテンツを修正してから、3ページ目(20位台)にまで落ちてしまった。そのため、このキーワードでのアクセス数が、上位のときの1割くらいにまで落ち込んでいる。ページが変わる毎にアクセス数が1/3づつ落ちるという説があるが、もっと落ちるようだ。
2005/10/02のBlog
[ 12:44 ]
[ ブログの話題 ]
最近、「Keyword」(key.blogdns.net)というサイトから、無用なトラックバックが来ることがある。記事中の単語に反応して自動でトラックバックを送ってきているようだ。
このサイトは、「RSSを公開しているブログの、ブログ内キーワードでブログ同士を結び付る実験サイトです」
ということらしい。
ブログの更新Pingか何かを監視し、記事中の単語をキーワードに、同じキーワードを持つブログが一覧できるサイトを作っている。ダイナミックDNSを利用した個人のサイトのようである。自分のサイトでどんな実験をされようと一向にかまわないが、自動で無用なトラックバックを送ってくるのは、迷惑だ。
----追記(10/2)----
上の記事に「更新Pingか何かを監視し」と書いたが、何をトリガーにしてトラックバックを送ってくるのか、不明だ。「Keyword」のサイトで検索すると、その検索ワードでトラックバックを送ってくるというレポートもあるが、やってみたが、再現しない。
更新Pingを打ってみて、ほぼ24時間後にTBが来たが、時間がかかりすぎで、関係あるかどうかわからない。結局のところわからない。
このサイトのやりたいことは、トラックバックを送り、同じキーワードを持つブログ間の「お見合い」をさせたいのではないかと思うが、これこそ「余計なお世話」である。
もっと単純に、目的は、AdSenseのクリック稼ぎだけなのかもしれない。
----追記(10/3 00:50)----
key.blogdns.netサイトから、
※TB機能止めました。
との案内が出た。一件落着。
このサイトは、「RSSを公開しているブログの、ブログ内キーワードでブログ同士を結び付る実験サイトです」
ということらしい。
ブログの更新Pingか何かを監視し、記事中の単語をキーワードに、同じキーワードを持つブログが一覧できるサイトを作っている。ダイナミックDNSを利用した個人のサイトのようである。自分のサイトでどんな実験をされようと一向にかまわないが、自動で無用なトラックバックを送ってくるのは、迷惑だ。
----追記(10/2)----
上の記事に「更新Pingか何かを監視し」と書いたが、何をトリガーにしてトラックバックを送ってくるのか、不明だ。「Keyword」のサイトで検索すると、その検索ワードでトラックバックを送ってくるというレポートもあるが、やってみたが、再現しない。
更新Pingを打ってみて、ほぼ24時間後にTBが来たが、時間がかかりすぎで、関係あるかどうかわからない。結局のところわからない。
このサイトのやりたいことは、トラックバックを送り、同じキーワードを持つブログ間の「お見合い」をさせたいのではないかと思うが、これこそ「余計なお世話」である。
もっと単純に、目的は、AdSenseのクリック稼ぎだけなのかもしれない。
----追記(10/3 00:50)----
key.blogdns.netサイトから、
※TB機能止めました。
との案内が出た。一件落着。
2005/09/30のBlog
[ 03:00 ]
[ 日々の暮らし ]
belageさんの「皆さん愛用の筆記用具を教えてください」へのTB
よく使う順(上から)
シャーペン
普段仕事で使うほとんどの筆記は、これ1本。「0.5mm B」。Microsoftからのもらいもの。
鉛筆
MITSU-BISHI UNI 2B。.画面のデザインをラフスケッチしたりするときに使う。削ると消耗するので、その都度購入。
タブレットペン
WACOMのタブレットペン。コンピュータで「筆記」するときは、これを使う。一切消耗しない。
ボールペン
黒、赤、シャーペンの3色になっているが、使うのはほとんど黒のみ。「公式」の書類を書くときだけ使う。これもMicrosoftからのもらいもの。
結局、お金がかかっているのは、鉛筆くらいで、それも年数本くらい。安上がり~。
よく使う順(上から)
シャーペン
普段仕事で使うほとんどの筆記は、これ1本。「0.5mm B」。Microsoftからのもらいもの。
鉛筆
MITSU-BISHI UNI 2B。.画面のデザインをラフスケッチしたりするときに使う。削ると消耗するので、その都度購入。
タブレットペン
WACOMのタブレットペン。コンピュータで「筆記」するときは、これを使う。一切消耗しない。
ボールペン
黒、赤、シャーペンの3色になっているが、使うのはほとんど黒のみ。「公式」の書類を書くときだけ使う。これもMicrosoftからのもらいもの。
結局、お金がかかっているのは、鉛筆くらいで、それも年数本くらい。安上がり~。
2005/09/29のBlog
[ 18:45 ]
[ ネットの話題 ]
ここのところスパムの話題ばかりだが、スパムブログ、あるいは、コピペブログというのがあることに今さらながら気が付いた。
テクノラティやその他のブログ検索やGoogleなどで検索したとき、キーワード毎に自分のブログの一部をコピーしたブログが(Seesaaに)いっぱい出来ているのは、前々から気が付いていた。
一方、Seesaaブログが先日行ったスパム対策に、「スパムブログ対策」という項目が入っているのも知っていた。これは、Seesaaでブログを新規開設するとき、画像で表示される認証コードを入れないといけないというものだ。Seesaaが何故こんな対策をしたのかわからなかった。
この2つが結びつかなかったのだが、このブログへのトラックバック「について」をたどって、その真相がわかった。
奇妙なアフィリエイトブログが流行中
ロボットによる自動生成のspam/fake blogが急増中
どっかの更新Pingを監視していて、新着情報があるごとに、Seesaaのブログ作成用APIを利用して、他人の記事をコピーしたコピペブログ(ミラーブログ)を次から次へと自動的に作成していたようだ。アフィリエイトとかリンク集めが目的のようだ。おそらく数千、数万というミラーができていたのだろう。
そんなことをしてまで稼ぐか!と関心するが、似たようなものは、他にもある。オープンソースのディレクトリDOMOZのミラーを作るというのがSEO業界界隈で流行(?)っている。DOMOZディレクトリの各階層から自分のサイトにリンクを貼り、膨大なリンクを集めてページランクを上げ、検索結果上位を狙うという手法だ。だが、Googleなどでは、これをやると、逆に落ちるようだ(上がっているのもあるらしいが)。他にも、Wikipedaia丸写しのブログもあるようだし、こういう手法は今後も出てくるだろう。
今回のコピペブログも、以前はGoogleの検索結果にいっぱい出てきていたが、今は消えている。Seesaaがこのブログを削除したためだと思う。あるいは、Googleが対策したのかもしれない。
今後も自分のブログのミラーを勝手に作られてしまう、という問題は避けようがないだろう。ネットには、いろいろとやっかいなことがいっぱいある。
テクノラティやその他のブログ検索やGoogleなどで検索したとき、キーワード毎に自分のブログの一部をコピーしたブログが(Seesaaに)いっぱい出来ているのは、前々から気が付いていた。
一方、Seesaaブログが先日行ったスパム対策に、「スパムブログ対策」という項目が入っているのも知っていた。これは、Seesaaでブログを新規開設するとき、画像で表示される認証コードを入れないといけないというものだ。Seesaaが何故こんな対策をしたのかわからなかった。
この2つが結びつかなかったのだが、このブログへのトラックバック「について」をたどって、その真相がわかった。
奇妙なアフィリエイトブログが流行中
ロボットによる自動生成のspam/fake blogが急増中
どっかの更新Pingを監視していて、新着情報があるごとに、Seesaaのブログ作成用APIを利用して、他人の記事をコピーしたコピペブログ(ミラーブログ)を次から次へと自動的に作成していたようだ。アフィリエイトとかリンク集めが目的のようだ。おそらく数千、数万というミラーができていたのだろう。
そんなことをしてまで稼ぐか!と関心するが、似たようなものは、他にもある。オープンソースのディレクトリDOMOZのミラーを作るというのがSEO業界界隈で流行(?)っている。DOMOZディレクトリの各階層から自分のサイトにリンクを貼り、膨大なリンクを集めてページランクを上げ、検索結果上位を狙うという手法だ。だが、Googleなどでは、これをやると、逆に落ちるようだ(上がっているのもあるらしいが)。他にも、Wikipedaia丸写しのブログもあるようだし、こういう手法は今後も出てくるだろう。
今回のコピペブログも、以前はGoogleの検索結果にいっぱい出てきていたが、今は消えている。Seesaaがこのブログを削除したためだと思う。あるいは、Googleが対策したのかもしれない。
今後も自分のブログのミラーを勝手に作られてしまう、という問題は避けようがないだろう。ネットには、いろいろとやっかいなことがいっぱいある。
2005/09/27のBlog
[ 15:43 ]
[ プログラミング ]
IPA(独立行政法人情報処理推進機構)が、ストリーム暗号「Toyocrypt」の
解読に世界で始めて成功したと発表した。解読に要した時間は27分。9/26日現在では20秒台で解読できるようだ。
Toyocryptは、2000年に東洋通信機株式会社から提案された暗号アルゴリズム。当初実質的に永遠に解読できない(100億年かかる)との触れ込みだったが、理論的に解読可能であることが示されていた。そのため、この暗号の解読技術を競う指標として人気の暗号だった。2002年頃は、2^96(8万の1兆倍の1兆倍)の計算量(100億年)がかかるといわれていたものが、去年では、2^29(5億)の計算量にまで一気に下がっていた。
今回の発表は、理論的可能性だけでなく、これを実際に解読したもの。64ビット2GHzのCPUの128倍の性能をもつ、暗号研究専用の並列グリッドコンピュータを使ったようだ。
攻撃法は、Algebraic Attack(代数的攻撃)という手法だそうだが、グレブナー基底探索アルゴリズムというのを使うらしい。こうなると、数学苦手の我輩では、とても理解不能。
暗号の方式には、ブロック暗号とストリーム暗号がある。DESなどブロック暗号では、平文(ひらぶん、と読む)を数バイトのブロック毎に区切って暗号化していくが、ストリーム暗号ではビット毎、あるいはバイトごとに順次暗号化する。そのため、高速に暗号化できるが、比較的解読され易いという問題もある。ストリーム暗号は、無線LANのWEPやBluetoothなどでも使われている。
暗号は、解読されないために使うものだが、解読するために人気がある暗号というのも面白い。
解読に世界で始めて成功したと発表した。解読に要した時間は27分。9/26日現在では20秒台で解読できるようだ。
Toyocryptは、2000年に東洋通信機株式会社から提案された暗号アルゴリズム。当初実質的に永遠に解読できない(100億年かかる)との触れ込みだったが、理論的に解読可能であることが示されていた。そのため、この暗号の解読技術を競う指標として人気の暗号だった。2002年頃は、2^96(8万の1兆倍の1兆倍)の計算量(100億年)がかかるといわれていたものが、去年では、2^29(5億)の計算量にまで一気に下がっていた。
今回の発表は、理論的可能性だけでなく、これを実際に解読したもの。64ビット2GHzのCPUの128倍の性能をもつ、暗号研究専用の並列グリッドコンピュータを使ったようだ。
攻撃法は、Algebraic Attack(代数的攻撃)という手法だそうだが、グレブナー基底探索アルゴリズムというのを使うらしい。こうなると、数学苦手の我輩では、とても理解不能。
暗号の方式には、ブロック暗号とストリーム暗号がある。DESなどブロック暗号では、平文(ひらぶん、と読む)を数バイトのブロック毎に区切って暗号化していくが、ストリーム暗号ではビット毎、あるいはバイトごとに順次暗号化する。そのため、高速に暗号化できるが、比較的解読され易いという問題もある。ストリーム暗号は、無線LANのWEPやBluetoothなどでも使われている。
暗号は、解読されないために使うものだが、解読するために人気がある暗号というのも面白い。
2005/09/25のBlog
[ 18:03 ]
[ ブログの話題 ]
以前から気になっていたことだが、今回のトラックバックスパム問題で、あちこちのブログなどを見ていると、トラックバックの意味が、すこし違った方向に理解されているように思う。かなり多くの人がトラックバックを「リンクを張ったことを通知する」機能のように理解しているようだ。だが、これは正確ではない。
例えば、「IT用語辞典e-words」によると、次のように説明している(抜粋)
ウェブログ(ブログ)の機能の一つで、別のウェブログへリンクを張った際に、リンク先の相手に対してリンクを張ったことを通知する仕組みのこと。
これは正確ではない。一方、「はてなダイアリー」では次のように説明している。(抜粋)
他の記事にその記事を話題にした記事のURLと概要を通知する機能、またその通知形式をさだめた枠組み。
こちらのほうがトラックバックについてのより正確な説明である。
「日本語版Wikipedia」では、もう少し曖昧な説明になる。(抜粋)
トラックバックはリンク元サイトに「このような記事からリンクを張った」という情報を通知する仕組みで、リンク元記事のURLやタイトル、内容の要約などが送信される。
不正確、曖昧な理解に共通していることは、トラックバックを「リンクを貼ったことを通知する機能」だと理解していることだ。しかし、トラックバックは、あえて誤解を恐れずに言うと、「リンクを貼ったことを通知する機能」ではない。
トラックバックは、Benjamin and Mena Trottによって、2002年に提案されたアイデアで、その仕様は現在バージョン1.2が最新版である。仕様によると、トラックバックとは、(抜粋)
The central idea behind TrackBack is the idea of a TrackBack ping, a request saying, essentially, "resource A is related/linked to resource B."
であり、「リソース A は リソース B に関連している、あるいはリンクしている」ということを通知する機能である。この場合の「リンク」は、必ずしも「リンクを貼った」ということを意味しない。関連しているという意味でのリンクである。仕様では、これ以上のトラックバックの明確な定義は無いのだが、入門用説明によると、Benjamin and Mena Trottは次のように書いている。
it is a method of person A saying to person B, "This is something you may be interested in." To do that, person A sends a TrackBack ping to person B.
...(snip)...
TrackBack ping: a ping in this context means a small message sent from one webserver to another.
つまり、トラックバックとは、AからBに対して伝える小さなメッセージであり、「これはあなたが興味を持っていることですよ」ということを、AがBに伝える機能なのだ。それによって、自動的に、BからAにリンクが貼られる。これは、逆向きのリンクになる。したがって、「TrackBack」というのだ。Bは、自動的に貼られたリンクをたどって、Aを参照することができる。ここには、AがBに対してリンクを貼ったことを伝える何の機能も無い。トラックバックでは、リンクを貼ることが必須の条件ではないのだ。
実際、TrackBackの仕様では、AがBに対して伝えるものは、
title Aのエントリのタイトル
excerpt Aのエントリの要約
url AのエントリのURL
blog_name Aのブログ名
の4つの情報だけである。このうち、urlだけが必須で、あとは無くても良い。
AがBにリンクを貼っていようがいまいが関係なく、トラックバックを送ることができ、その結果としてBからAにリンクが自動的に張られる。
「私の記事(あるいはWeb)は、あなたの記事(あるいはweb)に関連した記事(あるいはWeb)ですよ」ということをAがBに伝えるのが、トラックバックの機能なのだ。そのことによってBやBの読者は、Aの記事を見に行くことができる。
トラックバックのほとんどの説明で、「トラックバック先の記事へのリンクを貼る」という「マナー」がペアで説明されている。これは、Aが記事を書くとき、参照した元記事へのリンクがなければ、Aの読者には問題が理解できないだろうし、Bに対しても非礼であろう、という意味で、「マナー」なのである。もし、トラックバックが、「リンクを張ったことを通知する」機能であったとしたら、このような「マナー」などは必要ない。
トラックバックは、「リンクを張ったことを通知する」機能では無いが故に、その応用範囲が広く、普及していったのだ。(それゆえ、逆にスパムに遭うという弱点も持っている)
「リンクを張ったことを通知する」機能は、トラックバックとは別に、ピンバックという仕様がある。(以下ピンバックについては、別項)。(つづく)
例えば、「IT用語辞典e-words」によると、次のように説明している(抜粋)
ウェブログ(ブログ)の機能の一つで、別のウェブログへリンクを張った際に、リンク先の相手に対してリンクを張ったことを通知する仕組みのこと。
これは正確ではない。一方、「はてなダイアリー」では次のように説明している。(抜粋)
他の記事にその記事を話題にした記事のURLと概要を通知する機能、またその通知形式をさだめた枠組み。
こちらのほうがトラックバックについてのより正確な説明である。
「日本語版Wikipedia」では、もう少し曖昧な説明になる。(抜粋)
トラックバックはリンク元サイトに「このような記事からリンクを張った」という情報を通知する仕組みで、リンク元記事のURLやタイトル、内容の要約などが送信される。
不正確、曖昧な理解に共通していることは、トラックバックを「リンクを貼ったことを通知する機能」だと理解していることだ。しかし、トラックバックは、あえて誤解を恐れずに言うと、「リンクを貼ったことを通知する機能」ではない。
トラックバックは、Benjamin and Mena Trottによって、2002年に提案されたアイデアで、その仕様は現在バージョン1.2が最新版である。仕様によると、トラックバックとは、(抜粋)
The central idea behind TrackBack is the idea of a TrackBack ping, a request saying, essentially, "resource A is related/linked to resource B."
であり、「リソース A は リソース B に関連している、あるいはリンクしている」ということを通知する機能である。この場合の「リンク」は、必ずしも「リンクを貼った」ということを意味しない。関連しているという意味でのリンクである。仕様では、これ以上のトラックバックの明確な定義は無いのだが、入門用説明によると、Benjamin and Mena Trottは次のように書いている。
it is a method of person A saying to person B, "This is something you may be interested in." To do that, person A sends a TrackBack ping to person B.
...(snip)...
TrackBack ping: a ping in this context means a small message sent from one webserver to another.
つまり、トラックバックとは、AからBに対して伝える小さなメッセージであり、「これはあなたが興味を持っていることですよ」ということを、AがBに伝える機能なのだ。それによって、自動的に、BからAにリンクが貼られる。これは、逆向きのリンクになる。したがって、「TrackBack」というのだ。Bは、自動的に貼られたリンクをたどって、Aを参照することができる。ここには、AがBに対してリンクを貼ったことを伝える何の機能も無い。トラックバックでは、リンクを貼ることが必須の条件ではないのだ。
実際、TrackBackの仕様では、AがBに対して伝えるものは、
title Aのエントリのタイトル
excerpt Aのエントリの要約
url AのエントリのURL
blog_name Aのブログ名
の4つの情報だけである。このうち、urlだけが必須で、あとは無くても良い。
AがBにリンクを貼っていようがいまいが関係なく、トラックバックを送ることができ、その結果としてBからAにリンクが自動的に張られる。
「私の記事(あるいはWeb)は、あなたの記事(あるいはweb)に関連した記事(あるいはWeb)ですよ」ということをAがBに伝えるのが、トラックバックの機能なのだ。そのことによってBやBの読者は、Aの記事を見に行くことができる。
トラックバックのほとんどの説明で、「トラックバック先の記事へのリンクを貼る」という「マナー」がペアで説明されている。これは、Aが記事を書くとき、参照した元記事へのリンクがなければ、Aの読者には問題が理解できないだろうし、Bに対しても非礼であろう、という意味で、「マナー」なのである。もし、トラックバックが、「リンクを張ったことを通知する」機能であったとしたら、このような「マナー」などは必要ない。
トラックバックは、「リンクを張ったことを通知する」機能では無いが故に、その応用範囲が広く、普及していったのだ。(それゆえ、逆にスパムに遭うという弱点も持っている)
「リンクを張ったことを通知する」機能は、トラックバックとは別に、ピンバックという仕様がある。(以下ピンバックについては、別項)。(つづく)
[ 17:27 ]
[ ブログの話題 ]
トラックバックが、「私の記事は、あなたの記事に関連する記事ですよ」ということを通知する機能であるのに対して、「リンクを張ったことを通知する」機能をピンバックという。
ピンバックは、2002年に Stuart Langridge and Ian Hicksonが提案したアイデアで、
その仕様は、現在バージョン1.0である。仕様ではピンバックを次のように説明している(抜粋)
Pingback is a method for web authors to request notification when somebody links to one of their documents. Typically, web publishing software will automatically inform the relevant parties on behalf of the user, allowing for the possibility of automatically creating links to referring documents.
つまり、ピンバックでは、Aさんが記事を書いたとき、その中にBさんへのリンクが含まれていれば、「リンクを張りました」ということをBさんに自動的に通知する。その結果、BさんからAさんへの逆リンクが自動的に作成される。つまり、リンクが自動的に相互リンクになるのだ。これが「リンクを張ったことを通知する」機能である。
ただし、現時点でピンバックを実装しているブログは多くない。このDoblogにも実装されていない。なぜトラックバックほど普及しないかの理由はわからないが、実装上のアーキテクチャの違いにあるのではないかと思う。以下少し技術的な話題になる。
-------------------------------------------------
TrackBackのベースになっているのは、RESTアーキテクチャと呼ばれる考え方である。RESTとは、REpresentational State Transferの略で、Apache Software Foundationのディレクターでもある Roy T. Fieldingが提唱している考え方だ。だが、RESTという新しいアーキテクチャがあるわけではない。現行のWebのありようを表すアーキテクチャの総称をRESTと呼んでいる。
つまり、RESTとは、特定のURIを指定し、標準的なHTTPプロトコルのコマンド(GET, POST,PUTなど)を使ってリソース(Webサイト)にアクセスし、リソースからは、その結果(Representational State)を返す(Transfer)、という現在Webで標準的に行われていることを表すアーキテクチャの名称なのだ。
TrackBackは、このRESTアーキテクチャをベースにしている。そのため、TrackBackのプロトコルは簡単で、単にトラックバッククライアントから必要なデータをPOSTするだけである。(細かいことを抜きにすれば)手順としてはWebのフォームからPOSTするのと何ら変わらない。
これに対して、PingBackの仕様は、RPC(Remote Procedure Call)ベースであり、少し複雑である。
1.まず、PingBackを通知する相手(PingBackサーバー)が、PingBackに対応しているかどうかを調査し、RPC Callが出来るPingBack URIを取得する。
2.次に、ソースURIとターゲットURIを指定してXML-RPCコールを実行する(POSTメソッドでXML文書を送る)
3.サーバーは、送られてきたXMLをパースしてソースURIとターゲットURIを得、それぞれ検査して、リンクを作成する。(スパム対策などもっと細かい手順もあるが省略)
大まかには以上のような手順になる。クライアント側では、リンク先の自動検出、PingBack URIの取得、サーバー側では、XMLのパース、ソースURIの検査などXML-RPC手順に沿わなければならない点が実装上、運用上の負荷になり、単なるPOSTで済んだTrackBackと較べて通信量も増える。このあたりの問題が、PingBackがあまり普及せず、比較的簡単な実装であるTrackBackが普及した理由ではないかと思う。今後、PingBackが普及するかどうかについても定かで無い。
-------------------------------------------------
以上、トラックバックとピンバックという2つのシステムについて見てきたが、言いたいことは、トラックバックは、一般に理解されているような「リンクしたことを通知する機能」では無いということである。トラックバックとは、「関連した記事(Web)であることを通知する機能」であり、単にリンクしたということだけではなく、もっと、広く応用できる機能なのである。
もちろん、相手の記事を参照して記事を書けば、元記事へのリンクを貼ることが「マナー」であることはいうまでもない。そうでなければ、Aさんの読者には何のことかわからないだろう。だが、トラックバックは、必ずしも相互リンクをしなければならないというものではない。関連する記事であれば、リンクせずにBさんに通知することもあり得る。新しい記事だけでなく過去の関連記事をトラックバックすることもある。様々な使い方ができるのだ。
自分の記事が他人の記事に関連しており、ぜひ読んで欲しい記事であるなら、それをトラックバックを使って通知することができ、そのことによって、以前は孤島であったWeb間に繋がりがでてくるのである。(ただし、このことは、関連も無いのにむやみにトラックバックを送ったり、広告や宣伝のために大量のトラックバックを送ったりするスパムを認めることではない。)
ピンバックは、2002年に Stuart Langridge and Ian Hicksonが提案したアイデアで、
その仕様は、現在バージョン1.0である。仕様ではピンバックを次のように説明している(抜粋)
Pingback is a method for web authors to request notification when somebody links to one of their documents. Typically, web publishing software will automatically inform the relevant parties on behalf of the user, allowing for the possibility of automatically creating links to referring documents.
つまり、ピンバックでは、Aさんが記事を書いたとき、その中にBさんへのリンクが含まれていれば、「リンクを張りました」ということをBさんに自動的に通知する。その結果、BさんからAさんへの逆リンクが自動的に作成される。つまり、リンクが自動的に相互リンクになるのだ。これが「リンクを張ったことを通知する」機能である。
ただし、現時点でピンバックを実装しているブログは多くない。このDoblogにも実装されていない。なぜトラックバックほど普及しないかの理由はわからないが、実装上のアーキテクチャの違いにあるのではないかと思う。以下少し技術的な話題になる。
-------------------------------------------------
TrackBackのベースになっているのは、RESTアーキテクチャと呼ばれる考え方である。RESTとは、REpresentational State Transferの略で、Apache Software Foundationのディレクターでもある Roy T. Fieldingが提唱している考え方だ。だが、RESTという新しいアーキテクチャがあるわけではない。現行のWebのありようを表すアーキテクチャの総称をRESTと呼んでいる。
つまり、RESTとは、特定のURIを指定し、標準的なHTTPプロトコルのコマンド(GET, POST,PUTなど)を使ってリソース(Webサイト)にアクセスし、リソースからは、その結果(Representational State)を返す(Transfer)、という現在Webで標準的に行われていることを表すアーキテクチャの名称なのだ。
TrackBackは、このRESTアーキテクチャをベースにしている。そのため、TrackBackのプロトコルは簡単で、単にトラックバッククライアントから必要なデータをPOSTするだけである。(細かいことを抜きにすれば)手順としてはWebのフォームからPOSTするのと何ら変わらない。
これに対して、PingBackの仕様は、RPC(Remote Procedure Call)ベースであり、少し複雑である。
1.まず、PingBackを通知する相手(PingBackサーバー)が、PingBackに対応しているかどうかを調査し、RPC Callが出来るPingBack URIを取得する。
2.次に、ソースURIとターゲットURIを指定してXML-RPCコールを実行する(POSTメソッドでXML文書を送る)
3.サーバーは、送られてきたXMLをパースしてソースURIとターゲットURIを得、それぞれ検査して、リンクを作成する。(スパム対策などもっと細かい手順もあるが省略)
大まかには以上のような手順になる。クライアント側では、リンク先の自動検出、PingBack URIの取得、サーバー側では、XMLのパース、ソースURIの検査などXML-RPC手順に沿わなければならない点が実装上、運用上の負荷になり、単なるPOSTで済んだTrackBackと較べて通信量も増える。このあたりの問題が、PingBackがあまり普及せず、比較的簡単な実装であるTrackBackが普及した理由ではないかと思う。今後、PingBackが普及するかどうかについても定かで無い。
-------------------------------------------------
以上、トラックバックとピンバックという2つのシステムについて見てきたが、言いたいことは、トラックバックは、一般に理解されているような「リンクしたことを通知する機能」では無いということである。トラックバックとは、「関連した記事(Web)であることを通知する機能」であり、単にリンクしたということだけではなく、もっと、広く応用できる機能なのである。
もちろん、相手の記事を参照して記事を書けば、元記事へのリンクを貼ることが「マナー」であることはいうまでもない。そうでなければ、Aさんの読者には何のことかわからないだろう。だが、トラックバックは、必ずしも相互リンクをしなければならないというものではない。関連する記事であれば、リンクせずにBさんに通知することもあり得る。新しい記事だけでなく過去の関連記事をトラックバックすることもある。様々な使い方ができるのだ。
自分の記事が他人の記事に関連しており、ぜひ読んで欲しい記事であるなら、それをトラックバックを使って通知することができ、そのことによって、以前は孤島であったWeb間に繋がりがでてくるのである。(ただし、このことは、関連も無いのにむやみにトラックバックを送ったり、広告や宣伝のために大量のトラックバックを送ったりするスパムを認めることではない。)
2005/09/21のBlog
[ 17:56 ]
[ ブログの話題 ]
Doblogでのトラックバックスパムやコメントスパムに対する機能強化の要望を書いてみました。Doblog編集部や開発者の方に、この記事を読んで対応していただければ嬉しいな、という想いで書いています。->[Doblogスタッフブログ][開発者日記][目安箱]
はじめに
この間、アダルトブログからのトラックバックスパム問題で、Doblogのシステムとその対応にいくつかの問題点が浮かび上がってきています。アダルトブログからのトラックバックスパムは、Doblogに限ったことでなく、数ヶ月前から他のブログでも問題になっており、それぞれそれなりの対応、対策を行っています。それがいよいよDoblogにも上陸したわけです。しかし、こういうトラックバックスパムやコメントスパムの問題は、この程度はまだまだ序の口で、海外からのもっと本格的なスパムがやってくるのもそう遠くないかと思います。そこで、今のうちに、こういう機能を実装して欲しいという個人的な要望を優先順位の高い順に書いてみました。
すべてのトラックバックやコメントを拒否する機能
管理メニューの中で、ユーザが、トラックバックやコメントの受付をOFFにできる機能です。いわば、メインスイッチのようなものです。これを切れば一切のトラックバックやコメントを受け付けないようにできれば、緊急の場合も、ユーザが独自に対応できます。このスイッチは、トラックバック、コメントについてそれぞれ別個に設定できることが必要です。
スパムトラックバック、スパムコメントの定期的な自動削除機能
毎日のデータベース更新時に、編集部がスパムと認定したトラックバックやコメントを一括して自動的に削除する機能です。
この機能があると、スパムに気が付かないユーザや所用で削除できないユーザ、さらに、手動では対応できないほど多量に入っていたスパムをクリーンにできます。これは、状況により、必要なとき随時ということでもかまいません。
スパムの認定は、ユーザからの通報やトラフィックの監視をしていれば情報は集まるかと思います。誤認定や恣意的な認定が無い様、認定ルールを明確に明文化しておくことも必要かと思います。
以上ができるだけ早急に実装して欲しいと思っている対策ですが、それ以外に次のような機能があれば有用かと思います。
ユーザが、拒否ワードを設定できる機能
トラックバックやコメントのタイトル、本文にユーザが指定したキーワードが含まれていた場合、そのトラックバックやコメントを受け付けない機能です。
同じワードでも不快に感じる人、感じない人さまざまですので、これをユーザが独自に制御できればスパム対策をユーザ独自の判断で行うことができます。
もちろん、スパムメール同様、キーワードフィルターをすり抜けるべく創意工夫したスパムもでてきますが、比較的容易に実装できる機能としては有用かと思います。
ユーザが、拒否URLを設定できる機能
上記と同様です。拒否URLは、ドメイン全体、個別ホスト、あるいは、ディレクトリについて任意に設定できるようになっていると有用かと思います。
ドメイン全体 sample.com
特定ホスト host.sample.com
ディレクトリ host.sample.com/abc/
のように。
以上がユーザが設定出来る機能ですが、それ以外に、ブログシステムとして以下の機能が実装されていればさらに強力にブロックできるかと思います。
同一ドメインから一定時間内に一定数以上送られてくるTrackBack Pingの拒否
海外からの本格的なスパム攻撃に有用です。私の手元で観測しているデータでは、海外から1時間に数十個から百数十個のTrackBack Pingが送られてくることがあります。Doblogでは、まだこうした集中攻撃は受けていないように見えますが、そうならないうちに、これらに自動的に対応することが必要かと思います。
ただし、この機能は、ボットネットのゾンビなどを利用して、複数ドメインから一斉に送られてくる分散型スパム、あるいは、WebサーバーにTrackBack Pingの自動送信スクリプトを仕掛け、Webへの訪問者をトラックバッククライアントにして、訪問者のブラウザから自動的に送信してくるWeb型のスパム攻撃に対しては有効ではありません。またもちろん、スロースキャンのステルス型スパムには効きません。
ドメイン同一性検査
TrackBack Pingに指定したURLとPing送信元のドメインの同一性の検査です。
本格的なスパム業者は、メール同様、他のドメインからスパムを送りつけてきます。そのためドメインの同一性検査が有効になります。また、分散型スパムにも有効です。
ただし、弊害もあります。TrackBackの仕様では必ずしも、同一ドメインであることを要求していません。そのため、この仕様に沿ったトラックバッククライアントやWebのフォームからのトラックバックなど、同一ドメインでない正規のトラックバックも弾くことになります。
リンクチェック
トラックバック元記事にトラックバック先へのリンクがあるかどうかの検査です。
「はてな」など、リンクの無い場合はトラックバックを受け付けないように実装したブログもあります。このリンクチェックも対策として有効ですが、弊害もあります。
弊害の一つは、TrackBack Pingの内容で検査する場合、記事本文のSnippet(先頭部分200字程度--正式には、excerpt[抜粋]という)でしか判断できないため、記事の後のほうにリンクがあると判断できません。また、本文全文を回収すると無駄なトラフィックを発生させ、サーバーの負荷にもなります。
また、日本では、トラックバック元の記事に、トラックバック先へのリンクが無い場合、トラックバックマナー違反であると一般的に言われていますが、これは特殊日本的なことのようで、TrackBackの仕様上、あるいはTrackBackの意味上は、リンクを要求されるものではありません。したがって、リンクが無いからそれはスパムであるとは、必ずしも言えません。リンクチェックを実装した場合には、このようなスパムで無いトラックバックも弾いてしまうことになります。
(9/23追記)リンクチェックを強制したくないユーザもあるので、リンクチェックは、ユーザが設定できる機能にするほうが良いでしょう。また、TrackBack Pingのexcerptでのリンク先確認では、excerptでのリンク先偽装に対応できません。そのため、リンクチェックは、相手記事全文を回収してチェックする必要があります。
同一エントリーに対する同一ドメインからの複数トラックバックの拒否
海外からのトラックバックスパムを観測していると、同じ記事に対して、同じドメインから複数のトラックバックを同時に送ってきます。トラックバック元のURLはそれぞれ違いますが、ドメインは同一です。したがって、一定時間内に、同一エントリーに対して、同一のドメインから複数のトラックバックが来た場合のチェックを入れておけば、1つめは防げませんが、2つめ以降を拒否できます。(TrackBack Pingを一旦キューに入れて処理するように実装すれば、1つめも拒否できる。)
IPアドレスによる対策
IPアドレスでフィルターを掛けている実装もありますが、分散型スパムには効果が無いだけでなく弊害もあります。IPアドレスリスト(スパマーリスト)をメンテできる体制がある場合には有効でしょう。また、スパムのバーストのときはIPアドレス制限が有効に働きます。
その他もろもろ
スパム送信元の成りすましについて
TrackBackの仕様上、トラックバック元の偽装ができます。これを利用すれば対抗相手や競争者を蹴落とすことができます。例えば、AがBを蹴落としてやろうと考えたとき、Aが、BへのTrackBackを作成して一斉にスパミングすれば、トラックバックを受けた側からは、Bがスパマーに見えます。つまり、AがBに成りすますことができるのです。
そのことでBが、評判や信用を落としたり、サイトの閉鎖に追い込まれたりするかもしれません。ウィルスメールやスパムメールで使われている送信者アドレスの偽装と同様に、これは、TrackBackの仕様上避けることができません。また、この偽装を見破るのも難しいです。トラックバック元URLとトラックバック送信者のドメインが同一なら、おそらく偽装していないだろうと推定できますが、本格的スパムは別ドメインから送るのが普通なので、偽装かどうかを簡単には判別できません。
したがって、Bからスパムを受けたからといって、安易にBをスパマーと認定してしまうと、Aの企みに乗ってしまうことになります。今回のDoblogへのアダルトブログからのスパムでも、ブログ開設者とスパマーが同一かどうか疑った人はいなかったようですし、アダルトブログのサイトを管理するFC2やlivedoorでも速攻でブログを削除していました。今回それが同一であるという判断は正しかったのだと思いますが、今後も同一であるという保証はどこにもありません。このような問題は、今後の検討課題かと思います。
トラックバックURLの自動発見について
TrackBackの仕様上、その記事に対するトラックバックURLは、自動的に発見できます。Doblogの管理メニューから「トラックバックURLを表示しない」に設定しても、これは、記事にURLが表示されないだけで、トラックバックURLは自動的に入手できます。この点、Doblogは、TrackBackの仕様を忠実に実装しています。これは正しい実装です。今回、URLを消せば防げると思われた方もあったようですが、防げるとは限りません。
--- 追記(9/22)---
「開発者日記」から
※9/22 15:00現在、暫定処置としまして該当IPアドレスを遮断、及びスパムシステムの調査を元に対策を考察しております。
とのこと。今後の対応に期待しています。
--- 追記(9/23)---
IPアドレス規制は、24時間程度で早速破られている。まあ、そんなに甘くはない。
はじめに
この間、アダルトブログからのトラックバックスパム問題で、Doblogのシステムとその対応にいくつかの問題点が浮かび上がってきています。アダルトブログからのトラックバックスパムは、Doblogに限ったことでなく、数ヶ月前から他のブログでも問題になっており、それぞれそれなりの対応、対策を行っています。それがいよいよDoblogにも上陸したわけです。しかし、こういうトラックバックスパムやコメントスパムの問題は、この程度はまだまだ序の口で、海外からのもっと本格的なスパムがやってくるのもそう遠くないかと思います。そこで、今のうちに、こういう機能を実装して欲しいという個人的な要望を優先順位の高い順に書いてみました。
すべてのトラックバックやコメントを拒否する機能
管理メニューの中で、ユーザが、トラックバックやコメントの受付をOFFにできる機能です。いわば、メインスイッチのようなものです。これを切れば一切のトラックバックやコメントを受け付けないようにできれば、緊急の場合も、ユーザが独自に対応できます。このスイッチは、トラックバック、コメントについてそれぞれ別個に設定できることが必要です。
スパムトラックバック、スパムコメントの定期的な自動削除機能
毎日のデータベース更新時に、編集部がスパムと認定したトラックバックやコメントを一括して自動的に削除する機能です。
この機能があると、スパムに気が付かないユーザや所用で削除できないユーザ、さらに、手動では対応できないほど多量に入っていたスパムをクリーンにできます。これは、状況により、必要なとき随時ということでもかまいません。
スパムの認定は、ユーザからの通報やトラフィックの監視をしていれば情報は集まるかと思います。誤認定や恣意的な認定が無い様、認定ルールを明確に明文化しておくことも必要かと思います。
以上ができるだけ早急に実装して欲しいと思っている対策ですが、それ以外に次のような機能があれば有用かと思います。
ユーザが、拒否ワードを設定できる機能
トラックバックやコメントのタイトル、本文にユーザが指定したキーワードが含まれていた場合、そのトラックバックやコメントを受け付けない機能です。
同じワードでも不快に感じる人、感じない人さまざまですので、これをユーザが独自に制御できればスパム対策をユーザ独自の判断で行うことができます。
もちろん、スパムメール同様、キーワードフィルターをすり抜けるべく創意工夫したスパムもでてきますが、比較的容易に実装できる機能としては有用かと思います。
ユーザが、拒否URLを設定できる機能
上記と同様です。拒否URLは、ドメイン全体、個別ホスト、あるいは、ディレクトリについて任意に設定できるようになっていると有用かと思います。
ドメイン全体 sample.com
特定ホスト host.sample.com
ディレクトリ host.sample.com/abc/
のように。
以上がユーザが設定出来る機能ですが、それ以外に、ブログシステムとして以下の機能が実装されていればさらに強力にブロックできるかと思います。
同一ドメインから一定時間内に一定数以上送られてくるTrackBack Pingの拒否
海外からの本格的なスパム攻撃に有用です。私の手元で観測しているデータでは、海外から1時間に数十個から百数十個のTrackBack Pingが送られてくることがあります。Doblogでは、まだこうした集中攻撃は受けていないように見えますが、そうならないうちに、これらに自動的に対応することが必要かと思います。
ただし、この機能は、ボットネットのゾンビなどを利用して、複数ドメインから一斉に送られてくる分散型スパム、あるいは、WebサーバーにTrackBack Pingの自動送信スクリプトを仕掛け、Webへの訪問者をトラックバッククライアントにして、訪問者のブラウザから自動的に送信してくるWeb型のスパム攻撃に対しては有効ではありません。またもちろん、スロースキャンのステルス型スパムには効きません。
ドメイン同一性検査
TrackBack Pingに指定したURLとPing送信元のドメインの同一性の検査です。
本格的なスパム業者は、メール同様、他のドメインからスパムを送りつけてきます。そのためドメインの同一性検査が有効になります。また、分散型スパムにも有効です。
ただし、弊害もあります。TrackBackの仕様では必ずしも、同一ドメインであることを要求していません。そのため、この仕様に沿ったトラックバッククライアントやWebのフォームからのトラックバックなど、同一ドメインでない正規のトラックバックも弾くことになります。
リンクチェック
トラックバック元記事にトラックバック先へのリンクがあるかどうかの検査です。
「はてな」など、リンクの無い場合はトラックバックを受け付けないように実装したブログもあります。このリンクチェックも対策として有効ですが、弊害もあります。
弊害の一つは、TrackBack Pingの内容で検査する場合、記事本文のSnippet(先頭部分200字程度--正式には、excerpt[抜粋]という)でしか判断できないため、記事の後のほうにリンクがあると判断できません。また、本文全文を回収すると無駄なトラフィックを発生させ、サーバーの負荷にもなります。
また、日本では、トラックバック元の記事に、トラックバック先へのリンクが無い場合、トラックバックマナー違反であると一般的に言われていますが、これは特殊日本的なことのようで、TrackBackの仕様上、あるいはTrackBackの意味上は、リンクを要求されるものではありません。したがって、リンクが無いからそれはスパムであるとは、必ずしも言えません。リンクチェックを実装した場合には、このようなスパムで無いトラックバックも弾いてしまうことになります。
(9/23追記)リンクチェックを強制したくないユーザもあるので、リンクチェックは、ユーザが設定できる機能にするほうが良いでしょう。また、TrackBack Pingのexcerptでのリンク先確認では、excerptでのリンク先偽装に対応できません。そのため、リンクチェックは、相手記事全文を回収してチェックする必要があります。
同一エントリーに対する同一ドメインからの複数トラックバックの拒否
海外からのトラックバックスパムを観測していると、同じ記事に対して、同じドメインから複数のトラックバックを同時に送ってきます。トラックバック元のURLはそれぞれ違いますが、ドメインは同一です。したがって、一定時間内に、同一エントリーに対して、同一のドメインから複数のトラックバックが来た場合のチェックを入れておけば、1つめは防げませんが、2つめ以降を拒否できます。(TrackBack Pingを一旦キューに入れて処理するように実装すれば、1つめも拒否できる。)
IPアドレスによる対策
IPアドレスでフィルターを掛けている実装もありますが、分散型スパムには効果が無いだけでなく弊害もあります。IPアドレスリスト(スパマーリスト)をメンテできる体制がある場合には有効でしょう。また、スパムのバーストのときはIPアドレス制限が有効に働きます。
その他もろもろ
スパム送信元の成りすましについて
TrackBackの仕様上、トラックバック元の偽装ができます。これを利用すれば対抗相手や競争者を蹴落とすことができます。例えば、AがBを蹴落としてやろうと考えたとき、Aが、BへのTrackBackを作成して一斉にスパミングすれば、トラックバックを受けた側からは、Bがスパマーに見えます。つまり、AがBに成りすますことができるのです。
そのことでBが、評判や信用を落としたり、サイトの閉鎖に追い込まれたりするかもしれません。ウィルスメールやスパムメールで使われている送信者アドレスの偽装と同様に、これは、TrackBackの仕様上避けることができません。また、この偽装を見破るのも難しいです。トラックバック元URLとトラックバック送信者のドメインが同一なら、おそらく偽装していないだろうと推定できますが、本格的スパムは別ドメインから送るのが普通なので、偽装かどうかを簡単には判別できません。
したがって、Bからスパムを受けたからといって、安易にBをスパマーと認定してしまうと、Aの企みに乗ってしまうことになります。今回のDoblogへのアダルトブログからのスパムでも、ブログ開設者とスパマーが同一かどうか疑った人はいなかったようですし、アダルトブログのサイトを管理するFC2やlivedoorでも速攻でブログを削除していました。今回それが同一であるという判断は正しかったのだと思いますが、今後も同一であるという保証はどこにもありません。このような問題は、今後の検討課題かと思います。
トラックバックURLの自動発見について
TrackBackの仕様上、その記事に対するトラックバックURLは、自動的に発見できます。Doblogの管理メニューから「トラックバックURLを表示しない」に設定しても、これは、記事にURLが表示されないだけで、トラックバックURLは自動的に入手できます。この点、Doblogは、TrackBackの仕様を忠実に実装しています。これは正しい実装です。今回、URLを消せば防げると思われた方もあったようですが、防げるとは限りません。
--- 追記(9/22)---
「開発者日記」から
※9/22 15:00現在、暫定処置としまして該当IPアドレスを遮断、及びスパムシステムの調査を元に対策を考察しております。
とのこと。今後の対応に期待しています。
--- 追記(9/23)---
IPアドレス規制は、24時間程度で早速破られている。まあ、そんなに甘くはない。
2005/09/20のBlog
[ 01:11 ]
[ ブログの話題 ]
[関連するブログ][関連するブログ][関連するブログ]
主要なブログサービスが、トラックバックスパム(+コメントスパム)に対して、どのような対策をしているか調査した。ブログは、アクティブユーザ数の多い順に並べた。括弧内の数字は、BlogFan.org調査によるアクティブユーザ数。種類は、ユーザが出来る対策、システム側が行っている対策とし、主にヘルプなどからその機能を調べた。実際に各ブログで運用しての調査では無いため間違いがあるかもしれない。「ユーザ:」は、ユーザ側で出来る対策。「システム:」は、システム側で自動的に行っている対策。
結論:各ブログでの対応は、かなりの差がみられる。無対策、放置方針のブログから、いろいろと考えているところまでばらつきがある。本格的な対応は各ブログともこれからの課題のようだ。Doblogへの対策要望は別記事。
ライブドア(173,309)Help
ユーザ:禁止語句、禁止URLが設定できる
システム:不明
ヤプログ(123,923)Help
ユーザ:不明
システム:アダルトについては、システム的に制限、アダルトと思われるブログ、スパムなどの迷惑行為が認められるブログは、発見次第、警告または非表示措置
楽天広場(122,337)Help
ユーザ:トラックバックの拒否設定ができる
システム:迷惑行為が確認されているサイトからのトラックバックを、一括で受信拒否
Yahooブログ(116,808)Help
ユーザ:不明
システム:不明
goo(90,032)Help
ユーザ:トラックバックの拒否設定ができる
システム:トラックバック及びping送信元の監視、トラックバック及びping送信数の監視、信頼できないサイトからの受信制限、スパムリスト管理の強化、スクリプトなどにより大量に送信されるトラックバックの拒否
FC2(81,975)Help
ユーザ:不明
システム:業務妨害として訴訟準備、トラックバック数の送信制限、トラックバックを受信する際のリンク先の確認、ユーザー/システム上でのトラックバック受信制限
エキサイトブログ(75,395)Help
ユーザ:トラックバックを削除
システム:不明
はてなダイアリー(58,011)Help
ユーザ:不明
システム:リンクチェック、1エントリー1個に規制
アメーバブログ(49,538)Help
ユーザ:連絡により厳正に対処
システム:不明
Seesaa(48,925)Help
ユーザ:特定のURLからのトラックバックを禁止できる。承認したものだけを表示
システム:不明
JUGEM(27,671)Help
ユーザ:指定したIPアドレスからのコメント、トラックバックの拒否、指定したURLからのトラックバック拒否、指定したキーワードを含むコメント&トラックバックの拒否、同一エントリーに対して同一URLから複数トラックバッグの拒否
システム:不明
ココログ(27,418)Help
ユーザ: IPアドレスによる投稿規制リストが設定できる
システム:不明
AutoPage(23,815)Help
ユーザ:特定のリモートホストからのコメント書き込みとトラックバック送信を禁止できる
システム:不明
ドリコムブログ(18,320)Help
ユーザ:IPアドレスによるアクセス制限ができる
システム:システム側で随時一括削除
ウェブリブログ(14,891)Help
ユーザ:禁止ワード、禁止URL、禁止ブログ名の設定、リンクが存在しない場合の制限ができる
システム:不明
So-net blog(12,826)Help
ユーザ:指定URL, 指定キーワード設定できる
システム:システム的にトラックバックスパムを防御
ブログ人(11,244)Help
ユーザ:トラックバックを削除
システム:不明
LOVELOG(9,103)
ユーザ:トラックバックの禁止設定ができる
システム:不明
Doblog(6,977)
ユーザ:トラックバックを削除
システム:IPアドレス規制(暫定)
AOLダイアリー(2,675)Help
ユーザ:特定の言葉が含まれているコメントやトラックバックを拒否。トラックバックの送信元URL(またはドメイン)を設定して、トラックバックを禁止できる。
システム:一括削除、受信拒否
NetLaputaブログ(???)Help
ユーザ:不明
システム:一定時間内の同じIPからの重複トラックバックを拒否。IPアドレスから逆引きにより、一定長を超える場合、逆引きできない場合は拒否。
269g(???)Help
ユーザ:禁止URLを設定できる
システム:不明
ORICON BLOG(???)Help
ユーザ:不明
システム:IPアドレスによるアクセス制限、システム的に削除
ロリポブログ(???)Help
ユーザ:拒否URLを指定できる
システム:不明
関西どっとコムblog(???)Help
ユーザ:不明
システム:システム側で随時削除、FC2ブログからのトラックバック禁止
---修正履歴---
(9/23) 「はてなダイアリー」、「Yahooブログ」を追加
(9/23) 「ウェブリブログ」のリンクチェックをシステム機能からユーザ機能に修正
リンクチェックをしたく無いユーザもあるので、リンクチェックはユーザ機能としたほうが正解。
(9/27) 「Seesaa」のユーザ機能に承認機能を追加
(9/27) 「楽天広場」のシステム機能に一括受信拒否を追加
(9/27) 「Doblog」のシステム機能にIPアドレス規制を追加
(10/1) 「AOLダイアリー」のシステム機能を追加
主要なブログサービスが、トラックバックスパム(+コメントスパム)に対して、どのような対策をしているか調査した。ブログは、アクティブユーザ数の多い順に並べた。括弧内の数字は、BlogFan.org調査によるアクティブユーザ数。種類は、ユーザが出来る対策、システム側が行っている対策とし、主にヘルプなどからその機能を調べた。実際に各ブログで運用しての調査では無いため間違いがあるかもしれない。「ユーザ:」は、ユーザ側で出来る対策。「システム:」は、システム側で自動的に行っている対策。
結論:各ブログでの対応は、かなりの差がみられる。無対策、放置方針のブログから、いろいろと考えているところまでばらつきがある。本格的な対応は各ブログともこれからの課題のようだ。Doblogへの対策要望は別記事。
ライブドア(173,309)Help
ユーザ:禁止語句、禁止URLが設定できる
システム:不明
ヤプログ(123,923)Help
ユーザ:不明
システム:アダルトについては、システム的に制限、アダルトと思われるブログ、スパムなどの迷惑行為が認められるブログは、発見次第、警告または非表示措置
楽天広場(122,337)Help
ユーザ:トラックバックの拒否設定ができる
システム:迷惑行為が確認されているサイトからのトラックバックを、一括で受信拒否
Yahooブログ(116,808)Help
ユーザ:不明
システム:不明
goo(90,032)Help
ユーザ:トラックバックの拒否設定ができる
システム:トラックバック及びping送信元の監視、トラックバック及びping送信数の監視、信頼できないサイトからの受信制限、スパムリスト管理の強化、スクリプトなどにより大量に送信されるトラックバックの拒否
FC2(81,975)Help
ユーザ:不明
システム:業務妨害として訴訟準備、トラックバック数の送信制限、トラックバックを受信する際のリンク先の確認、ユーザー/システム上でのトラックバック受信制限
エキサイトブログ(75,395)Help
ユーザ:トラックバックを削除
システム:不明
はてなダイアリー(58,011)Help
ユーザ:不明
システム:リンクチェック、1エントリー1個に規制
アメーバブログ(49,538)Help
ユーザ:連絡により厳正に対処
システム:不明
Seesaa(48,925)Help
ユーザ:特定のURLからのトラックバックを禁止できる。承認したものだけを表示
システム:不明
JUGEM(27,671)Help
ユーザ:指定したIPアドレスからのコメント、トラックバックの拒否、指定したURLからのトラックバック拒否、指定したキーワードを含むコメント&トラックバックの拒否、同一エントリーに対して同一URLから複数トラックバッグの拒否
システム:不明
ココログ(27,418)Help
ユーザ: IPアドレスによる投稿規制リストが設定できる
システム:不明
AutoPage(23,815)Help
ユーザ:特定のリモートホストからのコメント書き込みとトラックバック送信を禁止できる
システム:不明
ドリコムブログ(18,320)Help
ユーザ:IPアドレスによるアクセス制限ができる
システム:システム側で随時一括削除
ウェブリブログ(14,891)Help
ユーザ:禁止ワード、禁止URL、禁止ブログ名の設定、リンクが存在しない場合の制限ができる
システム:不明
So-net blog(12,826)Help
ユーザ:指定URL, 指定キーワード設定できる
システム:システム的にトラックバックスパムを防御
ブログ人(11,244)Help
ユーザ:トラックバックを削除
システム:不明
LOVELOG(9,103)
ユーザ:トラックバックの禁止設定ができる
システム:不明
Doblog(6,977)
ユーザ:トラックバックを削除
システム:IPアドレス規制(暫定)
AOLダイアリー(2,675)Help
ユーザ:特定の言葉が含まれているコメントやトラックバックを拒否。トラックバックの送信元URL(またはドメイン)を設定して、トラックバックを禁止できる。
システム:一括削除、受信拒否
NetLaputaブログ(???)Help
ユーザ:不明
システム:一定時間内の同じIPからの重複トラックバックを拒否。IPアドレスから逆引きにより、一定長を超える場合、逆引きできない場合は拒否。
269g(???)Help
ユーザ:禁止URLを設定できる
システム:不明
ORICON BLOG(???)Help
ユーザ:不明
システム:IPアドレスによるアクセス制限、システム的に削除
ロリポブログ(???)Help
ユーザ:拒否URLを指定できる
システム:不明
関西どっとコムblog(???)Help
ユーザ:不明
システム:システム側で随時削除、FC2ブログからのトラックバック禁止
---修正履歴---
(9/23) 「はてなダイアリー」、「Yahooブログ」を追加
(9/23) 「ウェブリブログ」のリンクチェックをシステム機能からユーザ機能に修正
リンクチェックをしたく無いユーザもあるので、リンクチェックはユーザ機能としたほうが正解。
(9/27) 「Seesaa」のユーザ機能に承認機能を追加
(9/27) 「楽天広場」のシステム機能に一括受信拒否を追加
(9/27) 「Doblog」のシステム機能にIPアドレス規制を追加
(10/1) 「AOLダイアリー」のシステム機能を追加