naoyaの日記 RSSフィード

 | 

2009-02-08

entrylist の仕様 08:16

の件ですが、一部誤解があるようです。現在仕様はどうなっているかと言いますと

となっています。

ですので、例えばみなさんのはてなダイアリーなどでは全ドキュメントに対して遡ることができます。また http://blog.livedoor.jp/dankogai/ のような場合も同様です。

http://finalvent.cocolog-nifty.com/ のような場合は、そのドメインエントリーのうち、直近 10,000 件しか遡れません。ただし、国内トップサイトのようなサイトでない限り 10,000 エントリー以上ブックマークされたエントリーがあるサイト (合計 10,000 件以上ブックマークを集めたサイト、ではありません) はまずありません。

という仕様ですので、個人が自分サイトを調べる分に、制限されることはまずありません。またベテランブログの記事を辿りたいという場合も同様です。

問題になるのはニコニコ動画全体、はてなダイアリー全体、といった特定のサービスを全体にわたって過去に遡る場合です。この場合、数十ページから数百ページ以降は表示されないこともあります。ただし、これが辿れなくて問題になるのはプログラムからアクセスした場合で、ヒューマンアクセスで問題になることはまずないでしょう。

例えば Google の検索結果は 1,630,000 件ヒットしても実際には 500 件程度までしかページングできませんが、それで困る人はまずいません。それと同じです。

残る問題はプログラム過去データを分析したい、というユースケースです。こういった場合には URLブックマークの件数データを、生データを公開するなどで今後、対応していきたいと思っています。プログラムから統計情報を利用したいという限定された利用のために、通常のアクセスの速度を犠牲にするのは、サービス運営上難しいです。そういったトレードオフがあるということをご理解ください。(そもそも、ロボット過去データをクローリングして統計情報として利用するという利用ケースは推奨していません。過剰アクセスは通常のユーザーアクセスに悪影響を与えるので、制限せざるを得ません。新バージョンベータ公開時にサイトがダウンしたことがありましたが、原因はこの機能でした。旧バージョンで動作していたのは、スケールしていたからではなく、たまたまです。旧バージョンでも頻繁に、この機能が原因でサイトがダウンすることがありました。)

過去データの蓄積から検索したりといったことがブックマーク目的ではないかというのは、その通りです。ですので、できうる限り蓄積したデータは提供していますし、検索もできます。

集合知」というのはロングテールデータロボット等で取り出せるように公開しておく、ということだとは思いません。ロングテールにあるデータも含めて、何かしらの仕組みで情報要求通りに順位付けをした上で提示することだと思います。そのために検索や、関連エントリーなど(人気エントリー、新着エントリーといった限定された範囲のデータを対象にしたものではなく)広範囲のデータに対するアプローチがあります。今後もその辺りを継続的に強化していくつもりです。

MarvMarv2011/08/29 02:29Smack-dab what I was lkoonig for-ty!

hdrbfoehdrbfoe2011/08/29 16:31GiPtAP <a href="http://mybzyzjbfwhs.com/">mybzyzjbfwhs</a>

jwtdyrcjwtdyrc2011/08/30 17:56hT6UOg , [url=http://mqccmadzqshu.com/]mqccmadzqshu[/url], [link=http://gfgqiobngwhd.com/]gfgqiobngwhd[/link], http://cisroodfjnjj.com/

zejnpvzejnpv2011/09/01 23:47GJinVP , [url=http://rrmwxdyiguhf.com/]rrmwxdyiguhf[/url], [link=http://grxtdhnvwbar.com/]grxtdhnvwbar[/link], http://zamkqkdkmbjh.com/

 | 
この日記のはてなブックマーク数