![]() Ukupna ocjena ![]() Sadr�aj ![]() Dizajn ![]() A�urnost ![]() ![]() Diode su ocjene ![]() |
URL: cross.carnet.hr Producent: CARNet Urednik: Hrvoje Stipeti� Server: Sun Ultra Enterprise 2, Sun Solaris OS Server: Apache 1.3 web server, Harvest Datum: 24.10.1999. ![]() - Kad je CROSS krenuo, �ija je to bila ideja, s kojim ra�unalom... - Ra�unalo je bio Cyrix P150+ procesor. Bilo je to u jesen 1996., u Hrvatskom Crvenom kri�u. Motiv pokretanja novog servisa je bio uzvratiti uslugu akademskoj zajednici, koja je HCK-u omogu�ila pristup na Internet bez naknade. Internet tra�ilica je bila logi�an izbor, jer takvog servisa u Hrvatskoj u to vrijeme nije bilo. CROSS je slu�beno postao projekt CARNet-a u lipnju 1997. Prijelaz CROSS-a na CARNet je osigurao br�u vezu prema Internetu, tj. stranicama koje prikuplja, primjerenije ra�unalo i svu ostalu podr�ku koju CARNet pru�a svojim projektima. - Ako ja danas napravim stranicu, za koje vrijeme mogu o�ekivati da �u se na�i u indeksu? - Ako URL va�e nove stranice odmah po objavljivanju unesete na CROSS-u (na stranici za prijavu), stranica �e se pojaviti u indeksu za otprilike tri tjedna. U slu�aju da to ne u�inite, dovoljno je da na va�u stranicu postoji link s barem jedne stranice koja se nalazi u CROSS-u, ali u tom slu�aju �e trebati dvostruko dulje vrijeme da se stranica pojavi u indeksu. - �to bi webmaster trebao znati da lak�e u�e u indeks? - Za sam ulazak u indeks nije potrebno ni�ta drugo osim postaviti stranice i osigurati da u cijeloj ".hr" domeni postoji poneki hiperlink na njegove stranice. Ono �to autore stranica vjerojatno najvi�e interesira je kako biti prona�en kada korisnik postavi upit koji odgovara sadr�aju stranice. Za ve�inu tra�ilica je zajedni�ko, a niti CROSS nije iznimka, da provjeravaju sadr�aj HTML META tagova na stranici. Posebno su bitna dva taga: "Keywords" i "Description". Dodavanjem nekoliko klju�nih rije�i koje precizno opisuju sadr�aj na stranici u "Keywords" tag mo�e se posti�i da stranica bude vi�e rangirana kada posjetitelj tra�i neku od tih rije�i. Sadr�aj taga "Description", ako se unese, na CROSS-u �e biti prikazan u sa�etku ispod naslova stranice. - Kako funkcionira proces prikupljanja podataka? Krene se od popisa domena i onda se i��itavaju svi linkovi u dubinu? - Svaki novi krug prikupljanja stranica kre�e od preko 3.000 URL-ova koje dohva�a, iz njih �ita hiperlinkove, potom dohva�a te stranice, iz njih �ita hiperlinkove, i tako dalje. Jedno prikupljanje rezultira s oko 250.000 novih ili osvje�enih stranica. - Koliko �esto se iznova indeksira i pretra�uje hrvatski Web? - Ako nema nepredvi�enih te�ko�a u radu servisa, dva puta mjese�no. - Koje domene CROSS pretra�uje? - CROSS pretra�uje WWW stranice samo u ".hr" vr�noj Internet domeni. - �to je s stranicama koje nemaju .hr domenu? - �injenica je da se odre�eni broj Web stranica na�ih tvrtki, a i jo� ve�i broj osobih stranica, nalazi u ".com" ili nekim drugim vr�nim Ineternet domenama. Njih CROSS ne posje�uje, pa se tako niti ne indeksiraju. Dva su razloga tome. Prvo, broj Web stranica koja sada indeksira CROSS je na granici mogu�nosti trenuta�nog sustava, tako da bi zna�ajno pove�anje broja stranica, koje bi se moglo o�ekivati ako se uklju�e i neke stranice izvan ".hr" domene, moglo u�initi sustav neuportrebljivim u smislu predugog vremena potrebnog za dobivanje odgovora na upit. Drugi razlog je da je te�ko odrediti koje su to stranice izvan ".hr" domene koje treba posje�ivati CROSS, i u administrativnom i u tehni�kom smislu. Ako se dozvoljava posje�ivanje osobnih stranica unutar ".hr" domene, o�ekivat �e se isti tretman i stranica Hrvata koje se nalaze izvan ".hr" domene. Ili stranica koje na bilo koji na�in govore o Hrvatskoj. Ili pak stranica koje su zanimljive Hrvatima? Kako bi bilo te�ko nekome zabraniti ulazak u indeks, tako bi bilo te�ko i zadr�ati tra�ilicu samo na tim stranicama. Jednom kad bi iza�la iz okvira ".hr" domene, vi�e ne bi bilo egzaktnog kriterija na temelju kojeg tra�ilica automatski mogla prihvatiti ili odbaciti odre�eni URL. Uzmimo primjer GeoCities-a, koji sadr�i podosta "hrvatskih" stranica, ali je pitanje kako ih prepoznati po URL-u? Vjerojatno nikako. - Ima li stranica koje ne dopu�taju ulazak robotima i koliko ih ima? - Ima ih, ali ti se podaci ne prate. - Koliko ljudi dnevno i mjese�no pristupa? - U listopadu je prosjek oko 850 posjetitelja dnevno, tijekom posljednje godine oko 21.000 mjese�no. Pod posjetiteljam se smatra "user session" u trajanju od 15 minuta. Za tra�ilicu je vjerojatno najbitnija informacija o broju upita u indeks, a u listopadu on iznosi gotovo 3.000 dnevno. Valja re�i i da je od 1.1.1998. do danas na CROSS-u prikazano vi�e od 1.200.000 stranica s odgovorima na upit. - Koliki su tro�kovi odr�avanja? - Ra�unalo na kojem se nalazi CROSS je u dva navrata sklopovski nadogra�ivano, a i operacijski sustav je unaprije�en na noviju ina�icu. Osim toga, iz prora�una CARNeta financira se rad voditelja projekta i sistem in�enjera, kao i tro�kovi promocije projekta. - Koliko ljudi odr�ava Cross? - Sam servis odr�ava jedan �ovjek, dok se o ra�unalu i operacijskom sustavu brinu sistem in�enjeri SRCA. - Koji su problemi odr�avanja? - Mo�e se re�i da je ponajve�i problem odr�avanja dugotrajnost postupka prikupljanja dokumenata. A�urnost sustava tra�i da se taj proces odvija �to �e��e, ali treba imati na umu i da "robot" koji prikuplja stranice treba biti obazriv prema poslu�iteljima s kojih dohva�a stranice, te imati odre�enu pauzu izme�u dohvata dvaju stranica s istog poslu�itelja. Npr. ako se �eli u cijelosti pregledati WWW sjedi�te s 5000 dokumenata, i to tako da se stranice dohva�aju tempom od jedne stranice u dvije minute, proces �e potrajati sedam dana. Imaju�i u vidu da su u ".hr" domeni, prema podacima za rujan, aktivna 2624 WWW sjedi�ta, mo�e se predo�iti o obimu posla koji CROSS treba obaviti za jedno prikupljanje. No jo� bitniji problem s kojim se suo�ava CROSS je problem kori�tenja, a ne odr�avanja: vrijeme koje posjetitelj �eka da bi dobio odgovor na upit je oko 12 sekundi za prvu stranicu rezultata, a 2 sekunde za ostale stranice. Ako to usporedimo s velikim svjetskim tra�ilicama, vidi se da je kvaliteta usluge znatno lo�ija. Imaju�i na umu da CROSS koristi nekomercijalnu programsku podr�ku i za tu namjenu relativno slabo ra�unalo, mo�e se objasniti ova razlika. U sada�njoj situaciji izlaz bi se mogao potra�iti u sustavnom smanjenju broja stranica koje indeksira CROSS (time bi se svjesno smanjila pokrivenost hrvatskog Weba), ili u investiciji u sna�niji poslu�itelj. - Koje su najtra�enije rije�i? Ho�ete li staviti listu najtra�enijih rije�i (neki pretra�iva�i to vani nude)? - Zasad se takvi podaci nisu objavljivali, a svojedobna analiza je pokazala da na CROSS-u op�enito najtra�enijem pojmu (prema navodima tra�ilica koje objavljuju podatke) ozbiljno konkurira samo ista rije� u kojoj je "x" zamijenjeno s "ks". |
|
![]() |
![]() |
![]() |