1. 1.
    0
    Beyaz Kitap: Derin Web: Gizli değer Surfacing
    Bergman, Michael K.
    (Kalıcı URL'ler, DOI, künye bilgisi dahil) diğer Ayrıntıları atla
    Cilt 7, Sayı 1, Ağustos 2001
    DOI: http://dx.doi.org/10.3998/3336451.0007.104
    izinler
    Bu Beyaz Kitap BrightPlanet sitede tek bir sürümüdür. Bir program için bir pazarlama aracı olarak tasarlanmış olsa da "kendi site ziyaretçileri hedefleyen, kapsamlı bilgi sağlamak için gereken varolan Web portalları için," Web yapısı iç yüzünü e-yayıncılık katılan tüm olanlar için değerli okuma yapar . -J.A.T.

    internet bugün arama okyanusun yüzeyi boyunca net sürükleyerek mukayese edilebilir. Büyük net yakalanmış olsa da, derin bir bilgi zenginliği hala var, ve bu nedenle, cevapsız. Nedeni basit: Web sitesi bilgilerin çoğu dinamik olarak oluşturulmuş siteler üzerinde çok aşağı gömüldü ve standart arama motorları bulmak asla.

    Geleneksel arama motorları yüzeyi Web sayfaları spidering veya sürünerek kendi endeksleri oluşturabilirsiniz. Keşfedilen için, sayfa statik ve diğer sayfalara bağlantılı olmalıdır. Geleneksel arama motorları "bakın" ya da derin Web içeriğini alamaz - onlar belirli bir arama sonucu dinamik oluşturulana kadar bu sayfaları yok. Geleneksel arama motoru tarayıcılarının yüzeyinin altında delmeyin Çünkü, derin Web şimdiye kadar gizlendi.

    Derin Web yüzey Web'den nitelik bakımından farklıdır. Deep Web kaynakları yalnızca doğrudan bir isteğine yanıt olarak dinamik sonuçlar elde aranabilir veritabanları içeriklerini depolamak. Ama bir doğrudan sorgu aramak için zahmetli bir yol "bir defada bir" dir. BrightPlanet arama teknolojisi aynı anda birden çok iş parçacığı teknolojisini kullanarak doğrudan sorgular onlarca yapım sürecini otomatikleştiren ve böylece almak eleme, sınıflandırma ve "hem" derin "ve yüzey düzenleme, belirleme yeteneğine sahiptir şimdiye kadar sadece arama teknolojisi, bir "içerik.

    Bilgi Çağı'nın en imrenilen emtia gerçekten bilgi ise, o zaman derin bir Web içeriğinin değeri ölçülemez. Bu akılda, BrightPlanet 13 Mart ve 30, 2000 tarihleri ​​arasında toplanan verilere dayalı bir çalışmada derin Web boyutu ve alaka sayısal gelmiştir. Bizim temel bulgular şunlardır:

    Derin Web üzerinde genel bilgi şu anda yaygın olarak tanımlanan World Wide Web fazla 400-550 kat daha büyüktür.
    Derin Web yüzeyi Web bilgilerin ondokuz terabayt kıyasla bilgilerin 7.500 terabayt içerir.
    Derin Web yüzeyi Web bir milyar ile karşılaştırıldığında yaklaşık 550 milyar bireysel belgeleri içerir.
    200.000 'den fazla derin Web siteleri halen mevcuttur.
    Yüzey Web kırk kez boyutunu aşması kendileri tarafından yeterli - büyük derin Web sitelerinin Altmış topluca bilgi 750 terabayt hakkında içerir.
    Ortalama olarak, derin Web siteleri yüzey siteleri daha kuruş fazla aylık trafik başına elli almak ve daha çok bağlantılı yüzey siteleri daha olmakla birlikte, tipik (medyan) Derin Web sitesi de internet-arama halka bilinmemektedir.
    Derin Web internet üzerinde yeni bilgilerin büyük büyüyen kategoridir.
    Derin Web sitelerini geleneksel yüzey siteleri daha derin içerikli, dar olma eğilimindedir.
    Derin Web toplam kaliteli içerik yüzeyinin Web oranla 1,000 ila 2,000 kat daha fazladır.
    Derin Web içerik her türlü bilgi ihtiyacını, piyasa ve etki alanı son derece alakalı.
    Daha derin bir Web içerik yarısından konuya özel veritabanları bulunur.
    Derin Web yüzde tam doksan beş kamuya açık bilgiler - ücretleri veya abonelik tabi değildir.
    Perspektif bu bulgular koymak için, NEC Araştırma Enstitüsü [1] bir çalışmada, tahmin Nature dergisinde yayınlanan bu dizine Web sayfalarının büyük sayı (örneğin Google veya Northern Light gibi) her dizin ile arama motorları artık yüzde on altı yüzey Web. Veya 3000 bir - - onlar için mevcut sayfaları bugün onlar gibi arama motorları kullanımı zaman derin Web ekgib olduğundan, internet arama dolayısıyla 0.03% sadece arıyor. Kapsamlı bilgi alma gerektiğinde Açıkçası, çoklu yüzey ve derin Web kaynaklarının eş zamanlı arama gereklidir.
    Tümünü Göster
    ···
   tümünü göster