Internet'de Elektronik Kutuphaneler ve Tarama Mekanizmlari

Cumhuriyet Bilim Teknik, 1996

Mustafa Akgul (akgul@bilkent.edu.tr)

Internet tum dunyayi kapsayan, su anda 10 milyon civarinda irili ufakli her turden bilgisayardan olusan bir elektronik agdir. Insanlar arasinda iletisim, dayanisma, bilgi ve tecrube paylasimina olanak sagliyan Internet, modern, canli, dinamik ve hizli gelisen bir kutuphane goruntusune sahiptir. Bu nedenle, ozellikle arastirmacilar icin, Internet klasik kutuphanelerin onune gecmistir. Baslangicta arastirmacilar icin kurulan bir ag olan Internet, bugun bu niteligini yitirmis, elektronik nesne degisimi esasina gore, bir calisma, tanitim, eglence, oyun, bilgilenme ve ticaret ortami olmustur.

Elektronik nesnelere okul, ev ve isyerinden kolay erisim; ve istemci-sunucu mimarisi kamu hizmetleri, saydamlik, toplumsal denetim, toplumsal orgutlenme konularinda yeni olanaklar ortaya koymaktadir.

Su anda hesaplara gore 100 bin web, 10 bin gopher, 2-3 bin ftp, 1200 kutuphane, 1000 wais, 2200 telnet temelli, 1000 whois-phonebook-X.500 sunucusu bulunmaktadir. Haber gurubu ve liste sayisi 30--40 bin civarindadir. Tum kullanici sayisi ise 40--50 milyon civarinda tahmin edilmektedir. Turkiye'de ise 8-10 bin makina, 50-60 bin kullanici hesaplanmaktadir. Sunucu sayilari ise 160 web, 54 gopher, 40 ftp seklindedir. 200'ye yakin liste 10'a yakin'da listeci robotu calismaktadir.

Internet erisilecek nesneler acisindan bir okyanusa benzerse de, yeni baslayan birinin kolayca yolunu kaybedebilecegi bir orman (`jungle') izlemini verebilir. Internet gibi buyuk bir kutuphaneyi etkin kullanmak icin belirli bir yatirim yaparak bir ogrenme surecinden gecilmesi de kacinilmazdir. Iletisimin ve bilgisayarlarin onemi gittikce artacagina gore, bu konuda yapilacak cabalar, kisilerin kendilerini gelistirmek icin verimli bir yatirim olacaktir. Internet'in surekli gelisme ve degisme icinde oldugunu belirtmek isterim.

Nereden Baslamali ?

  1. Internet araclarinin amac ve yeteneklerini ogrenin. Bu araclari kendi gereksinimiz ve ortaminiza gore uyarlayin; ilgili `dot' ve `.ini' uyarlama dosyalarini etkin kullanmayi ogrenin. Ilgili kullanim klavuzunu ezberlemeyin ama en azindan bir goz gezdirin. Isinize yariyabilecek kisimlari bulup cikarin. Deney yapmaktan kacinmayin. `Bana bu kadari yeter istedigimi yapabiliyorum' kulaga hos gelen ama her zaman dogru olmiyan bir cumle. Size gerekenden bir miktar fazla bilmekte yarar var. Ornegin, Netscape gibi web uygulama programlari okudugunuz dosyalari degisik formatlarda saklama, basma, sonra tekrar okuma, baskasina postalama, ilgili baglanti bilgilerini saklama, dosya uzerinde tarama olanagi sunmaktadir. Tum web icin baslangic noktalaria, tarama makenizmalari ve yardim olanaklari sunmaktadir. Bu araclari ogrenmeye yapilan yatirim karsiligi etkin kullanim, zaman ve para acisindan verecektir.
  2. Interneti anlatan bazi dokumanlari (basili yada elektronik) okuyun. Bu tur dokumanlarin ya kendi makinanizda. yada kendi kurumunuzun veya hesabinizin oldugu kurumda (servis saglayici kurum)'da olmasina oncelik verin. Ingilizce pek cok dokuman bulabilirsiniz. Turkce yarim duzine kitap var. Elektronik olarak bulabileceginiz bazi dokumanlar: Internet Konusunda Cokca Sorulan Sorular ve Cevaplari: inet-tr.css text version (http)-tr.css } | text (ftp interface) | HTML
    Bilgiye Erisimin Yeni Arac ve Olanaklari: inet2.txt
    Internet Araclar, Olanaklar: kemer.txt | HTML
    liste.yardim (Liste mekanizmasi)
    turkiye.lists (turkiyedeki listeler)
    unix-all.html unix-all.css (Unix icin css) bilkent-arsiv.txt (Bilkent mailserver ve arsivi hakkinda) gibi turkce dokumanlar bulunmaktadir. Ingilizce dokumanlar arasinda wwwfaq.txt, wwwfaq.tar.z (web FAQ ) , ZEN.TXT (Zen and Internet), TIC.txt ( The Internet Companion), eff-guide-3.16.txt (EFF Guide to Internet ), online.zip (Ed Presno's Online World).
  3. Internet Baslangic Dokumanlari ve Sanal Kutuphaneler

    Cesitli kurum ve kisilerce hazirlanmis yeni baslayanlara yonelik internet'in bir konu siniflandirmasini ve her konuda cok onemli bazi baglanti bilgilerini sunan dokumanlar var: InternetStattingPoints.html (NCSA) | {\bf inet.services.html} yada Yanoff.html (Yanoff'un sectikleri), Yanoff | metaindex.html (Kongre Kutuphanesi)

  4. Internet Tarama Mekanizmalari

    Internet uzerinde kullandigi veri tabani, taradigi kaynak, kullandigi protokol, dokuman basina tuttugu veri miktari ve indeksleme/tarama yontemine gore degisen yuzu askin onemli tarama mekanizmasi var. Kullanicinin yazdigi bir veya daha fazla kelimeye uyan kayitlara ait bilgileri, once uyum derecesine gore bloklar halinde sunar. Kullanici istedigini bir fare tiklamasi veya tusa basarak alabilir. Tarama kapsami `ve', `veya' yada `degil' sozcukleri ingilizce (and, or, not) kullanilarak daraltilir yada genisletilir.

    Web Internet'in en gelismis aracidir. Web uygulama programlari, kullaniciya diger protokollere sunulan nesnelere erisim olanagi vermektedir. Web kullanimi kolay olmakla beraber, yer yer ilgili protokelle dogrudan calismak gerekebilir. Ornegin, yavas hatlarda bir ftp dosyasini web ile degil, ftp ile dogrudan almak zorunda kalabiliriz.

    Bu nedenle sadece webi tarayan bir `Altavista' sizin her ihtiyacinizi gormiyebilir. Bazi tarama mekanizmalari sadece kendi sunucusundaki baglanti bilgilerin uzerinde calismaktadir: Yahoo, Einet gibi. Simdilerde tarama mekanizmalarini birlestiren 3-4 hatta 16 veritabanini ayni anda sorgulayan Savy Search tarama mekanizmalari ortaya cikti. Ote yandan pek cok tarama mekanizmasini bir web sayfasinda sunan, hem pratik hemde kaynak israfini onleyen kisi ve kurumlar ortaya cikti: all1one, cui search, sleuth, web-search gibi. Tarama mekanizmalarinin listesini sunan pek cok web sayfasi vardir: yahoo, w3o, loc gibi. Bilkent Search dizini

    Gopher uzayinda {\it Veronica, Jughead,} menuler uzerinde tarama yapabilecigeniz bu mekanizmalari bir yada daha fazla anahtar kelime vererek tarayabilirsiniz. Taramalarin sonucu size menu olarak sunulacaktir.

    {\bf Wais}. Genellikle buyukce dokumanlar uzerinde tum metin uzerinde tarama olanagi veren bu tur taramalarin ayri bir yeri vardir. Once ilgi alaninizdaki {\bf .src}'leri tespit edip daha sonra onlar uzerinden tarama yapmak daha uygundur. {\tt Content Router for Wais}'i de goz onune alin.

    {\bf Listeler, Haber Guruplari}. Bunlarin arsivlerine genellikle web, wais, ve baska mekanizmalarla tarama yapabilirsiniz. Bilkent GN sunucusunda Liste ve benzeri mekanizmalar uzerinde tarama yapabilirsiniz

    {\bf ftp}. En temel, basit ve iyi calisan protokollerden biri olan FTP ozellikle buyuk dosyalarin tasinmasinda kullanilir. {\bf Archie} kayitli ftp arsivleri uzerinde tarama yapar. Archie sadece dosya adi uzerinde tarama yapar. Simdilerde {\bf Harvest} temelli tarama mekanizmalari ile ilgili yazilim paketinin dokumanlari, `okubeni' dosyalarindaki bilgiler uzerinde de tarama yapmaya izin verebilir. ftp arsivleri, web'in parcasi olabilir ama pek cok zaman degildir.

    Bunlara ek olarak adres bulmaya yonelik {\bf whois, phonebook, netfind, knowbot, X.500} gibi tarama mekanizmalari vardir.

    Surekli olarak tum Internet'i, ozellikle webi tarayan, siniflandiran, web sunucusu firmalar ortaya cikmaktadir. Bazilarina sizin kayit olmaniz gerekmektedir. Bunlarin en onemlilerinden bazilari:
    www.yahoo.com
    www.execite.com
    www.city.net
    www.mckinley.com
    www.stpt.com
    www.pointcom.com
    www.web-search.com
    www.intbc.com
    Toplu olarak pek cok tarama mekanizmasini URL:
    http://cuiwww.unige.ch/meta-index.html
    http://www.albaynet.net/all1one/
    http://www.cs.colostate.edu/~dereiling/smartform.html
    http://www.intbc.com/sleuth/
    Bunlari Bilkent'te Tarama dizininde bulmak mumkundur Tek baslarina onemli bazi tarama mekanizmalari ise:
    http://altavista.digital.com/
    http://www2.infoseek.com/
    http://www.opentext.com:8080/
    http://www.lycos.com/
    http://webcrawler.com/
    Bu html dosyalarini http://www.bilkent.edu.tr/Search/ altinda all-1-index.html, cui-meta-index, smartform.html, sleuth.html adlariyla bulabilirsiniz. Ayni yerde ayrica Searching.html, websearch1.html dosyalarini da bulabilirsiniz. Bilkent web'i `Gezinti Sayfasi' | `Yeni Baslayanlar Icin' ve `Bilkent Mirrors' sayfalarinda isinize yaracak pek cok baglanti bilgisi bulabilirsiniz.

    Turkiye'de Internet'inde neler oldugunun bir dokumunu http://ww.bilkent.edu.tr/inet-turkey/ adresinde bulabilirsiniz. Turkiye'deki tum webleri tarayan yeni kurulan iki tarama mekanizmasi ise: http://bornova.ege.edu.tr/Harvest/query (Ege) ve http://www2.best.com.tr/ (Best-Net)

    Bilkent Mailserver

    bilserv@bilkent.edu.tr adresinde eposta ile komutlari alip, sonuclari gene eposta ile gonderen bir robot program calismaktadir. Yeni baslayanlar asagidaki satirlari bu adrese gondermelerini ve gelecek dokumanlari incelemelerini oneririz.

    begin
    send  bilkent-arsiv.txt
    send inet-tr.css  
    send liste.yardim  turkiye.lists
    send kemer.txt 
    send inet2.txt  unix-all.css
    dir INFO/Netinfo
    dir INFO/Internet/General
    dir INFO/Turkce/css
    send internet.by-email 
    send uudecode.com
    dir INFO/Turkce/Internet
    dir UNIX/Internet/bilisim
    send online.zip
    send eff-guide-3.16.txt
    end