![]() |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||
![]() |
|||||||||||||
|
|
|||||||||||||
FAQHer kan du finde svar på nogle af de mest stillede spørgsmål i forbindelse med vores indsamling. 1. Hvem er Netarkivet?2. Hvad bliver arkiveret?3. Hvorfor ignorerer Netarkivets crawlere robots.txt?4. Hvad gør jeg, hvis jeg oplever tekniske problemer med Netarkivets crawlere5. Hvorfor bliver jeg høstet så tit?6. Hvilke brugernavne og passwords vil I bede om at få udleveret?7. Kan jeg risikere, at Netarkivets crawlere overbelaster min server?8. Hvad sker der hvis jeg forhindrer jer i at høste mit site?9. Udfylder Netarkivets crawler også formularer (forms)?10. Er de sider, Netarkivet crawler fra mit website, ikke irrelevante for kulturarven?11. Hvor lang tid gemmes materialet?12. Hvordan med ophavsretsloven?13. Hvem kan få adgang til data?14. Hvad er det for en lov, Netarkivet referer til?15. Er denne lov en konsekvens af nye EU-direktiver?16. Hvordan kan jeg se, om min server er blevet besøgt af Netarkivets crawler?17. Hvorfor udvikler Netarkivet deres egen crawler/spider/høster/robot?18. Hvad gør jeg, hvis jeg har forslag til tekniske forbedringer af Netarkivets system?19. Hvilke IP-numre kommer Netarkivets robotter fra?20. Hvorfor skal jeg kende Netarkivets IP-numre?21. Hvorfor overholder netarkivets robotter ikke HTML-meta-tags?1. Hvem er Netarkivet?Netarkivet er en virtuel organisation, der drives af Det Kongelige Bibliotek og Statsbiblioteket. 2. Hvad bliver arkiveret?Som udgangspunkt ønsker vi at arkivere alt det materiale, som en almindelig dansker kan opleve ved at klikke sig rundt i en browser. Det er vores ønske at kunne rekonstruere den oplevelse, man har som bruger af Internettet i 2006. 3. Hvorfor ignorerer Netarkivets crawlere robots.txt?På rigtig mange websites styrer robots.txt søgemaskinernes webcrawlere uden om materiale, som er helt nødvendigt for at kunne genskabe den oplevelse, man har som bruger af Internettet i 2006. 4. Hvad gør jeg, hvis jeg oplever tekniske problemer med Netarkivets crawlereVi vil meget gerne have, at man kontakter os per e-post:
, hvis vores crawler skaber problemer for et website. 5. Hvorfor bliver jeg høstet så tit?Vi høster hele den danske del af internettet 4 gange om året. Ind i mellem har vi brug for at teste nye indsamlingmetoder og versioner af den benyttede webcrawler. Dette betyder i praksis at nogle websites kan få besøg flere gange. Vi tilstæber altid kun at lave meget små testhøstninger hvorfor de ikke burde give nogen anledning til gener. 6. Hvilke brugernavne og passwords vil I bede om at få udleveret?Vi skaffer som udgangpunkt brugernavn og passwords på den måde, alle andre danskere gør: ved at udfylde en formular på de websites, vi gerne vil arkivere. Vi ønsker kun det materiale, som enhver dansker kan se på Internettet. 7. Kan jeg risikere, at Netarkivets crawlere overbelaster min server?Vi har en belastningsgrænse på 3 http-connections pr. sekund.
Det kan langt de fleste webservere følge med til. 8. Hvad sker der hvis jeg forhindrer jer i at høste mit site?Hvis vi bliver opmærksomme på det, vil vi rette henvendelse og prøve at finde frem til en løsning der tilgodeser dine behov og vores forpligtigelse til at indsamle bevare den danske kulturarv på Internettet. Hvis vi ikke kan blive enige, har vi i allersidste ende muligheden for at gå rettens vej. 9. Udfylder Netarkivets crawler også formularer (forms)?Teknisk skal man huske at skelne mellem POST og GET forespørgsler via http-protokollen. 10. Er de sider, Netarkivet crawler fra mit website, ikke irrelevante for kulturarven?Med hensyn til sidernes relevans er princippet i indsamlingen, at det i videst mulige omfang bør være fremtidens forskere, der afgør relevansen, snarere end aktører på indsamlingstidspunktet. 11. Hvor lang tid gemmes materialet?Så længe politikerne mener, at det er vigtigt at gemme vores kulturarv. 12. Hvordan med ophavsretsloven?Pligtafleveringsloven tillader, at vi indsamler materiale der er underlagt ophavsret. 13. Hvem kan få adgang til data?Netarkivet.dk er ikke et åbent arkiv, som f.eks. archive.org. 14. Hvad er det for en lov, Netarkivet referer til?Den 1. juli trådte en ny pligtafleveringslov i kraft i Danmark: http://www.ft.dk/Samling/20041/lovforslag/L77/som_fremsat.htm 15. Er denne lov en konsekvens af nye EU-direktiver?Nej, loven er et resultat af en modernisering af Kulturministeriets indsats inden for bevaring af kulturarven. 16. Hvordan kan jeg se, om min server er blevet besøgt af Netarkivets crawler?Vores crawler identificerer sig med en streng der indeholder en URL til en infoside: 17. Hvorfor udvikler Netarkivet deres egen crawler/spider/høster/robot?Det gør vi ikke. Vi bruger open-source høsteren Heritrix, som er udviklet af Internet Archive i samarbejde med de andre nordiske webarkiver og biblioteker fra hele verden. 18. Hvad gør jeg, hvis jeg har forslag til tekniske forbedringer af Netarkivets system?19. Hvilke IP-numre kommer Netarkivets robotter fra?Netarkivets robotter kommer pt. fra følgende IP-numre: 20. Hvorfor skal jeg kende Netarkivets IP-numre?Nogle sites rummer automatisk eksklusion af robotter der ikke overholder robots.txt. 21. Hvorfor overholder netarkivets robotter ikke HTML-meta-tags?
|
|||||||||||||
![]() |
|||||||||||||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|