MacFan
ActueelSoftwareServiceForums
Nu in MacFan
MacFan•100:
Wie erft de Jobs-factor?

• Alles over Mountain Lion
• FileMaker versnelt mobiele koers
• Audiomix in een handomdraai

Nú overal in Nederland en België te koop voor € 7,95!

leesverder

abonneren
MacFan Webwinkel


eMacFan
De nieuwsbrief
van MacFan (gratis!)

Blijf up-to-date en meld je aan. Wekelijks het belangrijkste Mac-nieuws in je e-mail: MacFanFlitsen!

leesverder
- Powered by - CoMedia web & data concepts
Blue Crab
Slurpen, die website
  Naar overzicht MacFan•98
[Vorige] [Volgende]
Limit Point Software
Shareware: € 19,99
Blue Crab Besproken in MacFan 98, pag. 76
Rubriek: MacFanSelectie
Bestel MacFan 98
 
Download (Webpagina) 
 

MacFan schreef
De blunder van de baas, die ene gênante foto van je vrijgezellenfeest, het artikel waar je liever niet aan herinnerd wil worden. Allemaal staan ze op internet en volgens de volkswijsheid verdwijnt die informatie nooit en nimmermeer. Aan de andere kant van de balans ligt het materiaal waarvan je zeker weet dat het in het verleden op een website stond. Maar waar is het nu? Verdwenen door de crash van een server, afgedankt bij een upgrade, verkocht of vernietigd. Foutmeldingen vliegen om je oren als je het spoor terug volgt en je weet het weer zeker: informatie op internet kan wel degelijk wegglijden in het zwarte gat van de geschiedenis.
Op internationaal niveau kan de WayBack Machine soms hulp bieden, al concentreert dit wereldwijde archief zich op tekst. Wil je dus bepaalde informatie op het web voor altijd tot je eigen beschikking hebben, dan haal je die zekerheidshalve naar je Mac toe. Dat hoeft niet klikje voor klikje: zogeheten webcrawlers nemen je de taak graag uit handen. In dit gezelschap onderscheidt Blue Crab zich door zijn vriendelijke werkwijze. Het pakket van softwarehuis Limit Point biedt een brede variatie aan instellingen. Je kunt de hele website binnenhalen inclusief de oorspronkelijke mappenstructuur. Daarmee blijft het mogelijk er offline doorheen te klikken. Voor andere doelen verzamelt Blue Crab net zo makkelijk alleen de afbeeldingen of uitsluitend de pdf-bestanden. Op verzoek verschijnt zo’n collectie direct in één gezamenlijke map.
De veelzijdige webcrawler kent nog meer slimme trucs. Als je weleens afbeeldingen zoekt op Google, weet je hoeveel tijd het kost om meerdere plaatjes op volledige grootte naar een map te downloaden. Dat karweitje neemt Blue Crab je helemaal uit handen: voer de zoekterm in en haal de eerste honderd op je gemak binnen of wijzig de standaardinstellingen voor nog meer resultaten. De makers zijn zo overtuigd van de verslavende werking dat je het pakket dertig dagen onbeperkt mag uitproberen. Daarna kies je voor aanschaf in de Mac App Store of via de website van de fabrikant voor gebruik met oudere versies van Mac OS X.
Let wel op je vrije schijfruimte: die loopt bij enthousiast archiveren akelig snel vol. Voor de zekerheid beperkt Blue Crab zijn slurpgedrag tot het adres waar je begint. Mocht die links naar CNN, Uitzending Gemist of een andere digitaal universum bevatten, dan ligt daar een slagboom voor.
De vrijwel onbeperkte mogelijkheden en hun waaier aan instellingen kun je voor herhaald gebruik vastleggen in configuraties voor bepaalde websites. Zo vis je gemakkelijk elke maand in de vijver van je favoriete stichting, bedrijf of overheidsinstelling. Webmasters moeten weten dat Blue Crab zich niets aantrekt van index-verboden uit het bestand robots.txt. Wel beloven de makers dat ze slechts één pagina tegelijk opvragen om de belasting van de server te beperken. Dat is mooi en heel beleefd, maar natuurlijk klikt zo’n robot een stuk sneller dan mensenhanden. Daar was het de gebruiker immers om begonnen.
 
Beschrijving ontwikkelaar
Blue Crab is a versatile app that you use to download the contents of a website to your Mac, in whole or in part. With Blue Crab you can:

• Conduct fast offline browsing and searching of a website.
• Create a snapshot of a website for historical archiving.
• Collect specific types of resources such as images or email addresses.
• Search current content more thoroughly than a search engine right on your Mac.
• Check a website for broken links, or generate a site map.
• Download groups of URL links at one time.

With Blue Crab you can download all the content including HTML, PDFs, graphics, video, file archives, etc., or use selective filtering to restrict downloads to specific kinds of files. For example, you can choose to save only the images Blue Crab finds, or just the PDFs. Blue Crab also supports "batch downloading" where you can collect a bunch of URLs, say by dragging them out of a browser window into Blue Crab, and then download them all at once. Use the Batch Download window for that.

Starting with a single webpage address Blue Crab begins traversing the site by following the links on the textual pages it finds, HTML, CSS, etc. Blue Crab does not stray off the domain of the starting URL; in other words it won't try to download the whole web! You can restrict Blue Crab to a subset of the given website by specifying strings that restrict which URLs are grabbed. There is also a convenient "stay in folder" option in every grabber window which restricts the crawl to URLs whose path must begin with the path of the starting URL. Use the Configuration Editor to modify the behavior of the crawling process.

Blue Crab has a special feature called the "Media Grabber" for easily downloading just the graphics, movies or PDFs on a website. When finding images, you can view a mini slide show as they are downloaded. You also have the option of "flattening" the download directory, i.e. putting all the downloaded images into one folder, or preserving the folder structure on the server, just as when downloading a whole website.

Once you download a collection of files you can search them with the built in text search window, which displays found files hierarchically, matching their location on the website. Blue Crab can search any file type supported by Spotlight, such as PDF or RTF, and provides convenient thumbnail previews. You can even view the index associated with each individual found file.

Finally, Blue Crab is gentle on the server. It processes only one URL at a time and may be configured to grab resources at delayed time intervals to further slow it down. This is important because it reduces stress on the server.


 
 
Werkt een link op deze pagina niet?
Laat het ons weten door hier te klikken!
Zoeken
 
MacFan 100 Alles
 
 
Zoeken