2004年05月 07日
Trackback できてませんでした↓
先日のコメントでりささんに指摘されるまで気がつかなかったのですが、このサイト、Trackback できませんでした。指摘された時はそーんな馬鹿なって思っていたんですが、本当でした。Win2K サーバー+IIS の時は大丈夫だったのに…。WinXP にした途端、です。Google で検索してみたところ、下記 Entry を発見。
WEBFACTORY ::: BLOG : トラックバックの問題解決
以下、サイトより引用です。なぜ失敗するかはリンク先を参照くださいませ。
(1) インターネット サービス マネージャを開き、BLOGを設置しているドメインのディレクトリのプロパティーを見る。(2) ディレクトリタブにある構成をクリックしてCGIの項目をダブルクリックして、ファイルの存在を確認するのチェックを外す。
(3) IISを再起動して完了。
うおぉぉ、Trackback できたー!素晴らしい!!!よくぞこのような複雑怪奇な設定を発見してくださいました!!!!WEBFACTORY 様の方角へはもう足を向けて眠れません!!!!ありがとうございました!!!
NetBEUI 破られるw
いや~、来ましたよ、ウィルス。しかもたくさんw 先日の Entry でご紹介した Net BEUI によるファイル共有フォルダにたくさんのウィルスファイル達が。Norton Internet Security を飛び越えて、ちょこん とそこにはウィルス君がいましてw Norton Anti Virus が引っ掛けてくれたので助かったわけで。今日お出ましになられたウィルスファイル達。
- W32.Spybot.Worm × 4
- W32.HLLW.Gaobotの亜種 × 1
まぁ、元々サーバーにはウェブ以外のファイルは置いていないからクラッシュしても大打撃になるほどの損害はないんだけどさ、結構嫌なもんです。バックアップ取るようにしよう…。
しかし、NetBEUI が安全だ、って誰が言ったのさ~。会社で詳しい人に聞いてみたら、構造的に外から丸見えになる可能性があるんだそうで。だから Microsoft は標準から外したがっていたわけです。この手のウェブ情報って結構アテにならんですな。
後さ、何処の誰や知らんけど(IP は分かるけど)、ping するなっちゅうねん。ぜーんぶはじいてます。嗚呼、恐ろしきかな自宅サーバー。
「念力」系
いやもう…馬鹿馬鹿しくってw 念力ブログ、よくこういうの思いつくなぁ。これってさ、哲学だよ。何もコンテンツはないのに、Comment や Trackback に人が集まってくる。でも、きっと何もない。みんな知ってる。それでも人は集まっている。不思議、不思議。
Similarity Search
Bulkfeed Smilarity Search をサイトに実装してみました。Similarity Search の詳細は下記 URL を参照くださいませ。
blog.bulknews.net: Bulkfeeds: Similarity Search リリース
Indivisual Entry の右横にその Entry に『似ている』と想像される Entry が表示されます。⇒ こんな感じ。amazon アソシエイト・プログラム系のエントリーが書かれた blog へリンクが張られていますね。これらを自動的に行う機能です。
ちょっと表示に時間がかかるかも?ので、一番右側においやって最悪でもコンテンツは参照できるように工夫してみました。ちなみに、2004年5月2日以前の Entry の Similarity Search はちょっと状態がおかしくなっています。これは過去の Entry ID との不整合によるものです。仕方ないかなーこれくらいは。もともと1ヶ月以内の Entry しか見ないみたいなので、鮮度の高い間だけの不具合ですし。
ちなみにこの Similarity Search ないしは 『類似度検索』ですが、多分、形態素解析と TF・IDF 法の応用です。いずれも文脈理解の研究分野で定石とされるような手法のようです。理屈は結構シンプル。
あるページとあるページの似ている・似ていないを検出する場合、ページに出てくる単語でマッチングをかけてやれば良い、と言うのがスタート地点。
が、文章の中には『です』とか『私』とかあまり重要でない単語は取り除いて評価したい。ので、形態素解析を用いてまず名詞、固有名詞抽出を行う。これではまだ不十分でそれら名詞のうち『重要』と想定される重みを算出するのが TF・IDF 法。あっちこっちでよく出てくる単語はあまり重要でない、そのページだけに出現する単語の重要度は高い、と言うポリシーの理論です。
実は僕、この理論の信憑性を疑っていたのですがw かなりばっちりヒットするなぁ。












