Menu

31 maart 2012

Automator: Tekst uit een PDF bestand halen

Het kan soms wel eens voorkomen dat je de tekst uit een PDF bestand in een ander tekstdocument wilt gebruiken. Wanneer je hiervoor kopiëren en plakken gebruikt dan zal je merken dat stukken tekst ontbreken of de tekst door elkaar staat.

Met behulp van Automator en de ‘extraheer’-functie is het mogelijk om de complete tekst uit een PDF bestand te halen, waarna je de tekst weer kunt bewerken in een andere willekeurige applicatie.

Volg hiervoor de onderstaande stappen:

Start Automator vanuit de map programma’s en selecteer als nieuw document: Takenreeks

Voeg aan de takenreeks toe: Bestanden en Mappen ▸ Haal opgegeven Finder-onderdelen op

Klik op de knop ‘Voeg toe…’ en selecteer het gewenste PDF bestand.

Voeg hierna aan de tekenreeks toe: PDF Bestanden ▸ Extraheer pdf-tekst

Selecteer bij ‘uitvoer’ de optie RTF-tekst als je de tekst inclusief de opmaak wilt exporteren. Eventueel kun je ook nog de lokatie en de bestandsnaam van het bestand wijzigen.

Klik hierna rechtsboven op de knop ‘Voer uit’ om de extractie van de tekst te starten. Nadat het process is afgerond heb je een tekstbestand met daarin de tekst van het PDF bestand.

Screencast:

http://www.youtube.com/watch?v=IjIjXg2d4yE





Gerelateerde tips:


Reacties


  • hares wardak 31 maart 2012 om 18:11

    is het ook mogelijk om de tekst uit PDF bestand te halen en converteren naar MS Word in plaats van text editor? met text editor heb je nog steeds dat alles niet geordend is als in het PDF bestand.

  • Jan 1 april 2012 om 12:55

    Hallo Hares, als je eenmaal het pdf bestand hebt omgezet als .txt bestand (zonder opmaak) of als .rtf bestand (met opmaak, zoals cursieve en/of vette letters), dan importeer je dat toch gewoon in Word of, wat ik zelf gebruik, NeoOffice? Ik kan me voorstellen dat in in Automator nog de taken toevoegt: start MS Word, open daarin nieuw bestand, importeer zojuist geëxporteerde .txt bestand. Klaar!

  • Hares 11 april 2012 om 16:55

    Hartelijk dank Jan!

  • Dyamant 2 september 2012 om 21:13

    Hi,

    Is het mogelijk om Tekst (naam+code) uit een jpeg bestand te halen,voor een listing in xls te maken ?

    thanks 4 a reply !,

    DY.

Een reactie toevoegen: