Trek getrokken paden uit PDF-bestanden met behulp van PHP en Linux

Ik ben op zoek naar een oplossing/API (bijv. Zoals PDFLib) die een getekend pad uit een grafische PDF kan extraheren (en verwijderen). Bijvoorbeeld een pad dat een afbeelding of logo schetst dat is getekend in Illustrator of Indesign (geen JPG-uitknippad), dat is ingesteld op een specifieke steunkleur (bijv. "CutContour"). Ik moet de gegevens ophalen die dat pad vormen om te extraheren voor gebruik in een snijsysteem.

Hoewel PDFLib tekst kan extraheren, kan het geen grafische elementen extraheren. Ik sta zelfs open voor oplossingen buiten PHP!

Bij voorbaat dank!

1

1 antwoord

Ik kon geen PHP pdf-parsers vinden, maar ...

Als je niet tegen het gebruik van een alternatieve taal bent, vond ik een edelsteentje dat een pdf-bestand zal ontleden. Van de documenten lijkt het alsof je een hash van de objecten van een bestand kunt pakken.

http://rubygems.org/gems/pdf-reader

Als u op zoek bent naar een pure programmatische oplossing die mogelijk werkt, maar lijkt het moeilijk te zijn.

Anders weet ik dat je pdf-bestanden in Adobe Illustrator kunt openen en op die manier afbeeldingen kunt uitpakken. U zou zelfs enkele javascripts kunnen schrijven die het proces zullen automatiseren. Deze oplossing werkt uiteraard niet op Linux.

0
toegevoegd