Linux PDF-Shuffler -> Windows ?
#1
Hallo PC-Spezis,

ich habe unter Linux den PDF-Shuffler ausprobiert zum Extrahieren von gewünschten Seiten aus größeren PDF-Files.
Das hat funktioniert und mir gefallen.
Für Windows habe ich kein vergleichbares kostenloses Tool mit visueller Auswahl der zu löschenden Seiten gefunden.
Deshalb würde ich den PDF-Shuffler gern unter Windows benutzen.
Kann mir jemand erklären, wie man das anstellt (eventuell mit mingw o.ä. ?).

MfG Kai
Zitieren
#2
Das wird wohl nix werden. Warum nutzt Du nicht weiter Linux dazu ?

Wenn Du nur einzelne Seiten extrahieren willst, kannst Du Gimp unter Windows nehmen.
MfG Mario
Zitieren
#3
Hallo Mario,

ich arbeite vornehmlich unter Windows und habe nur für den Internetzugang einen älteren Laptop unter Linux laufen.
Der ist aber deutlich langsamer als mein neuester Windows-Rechner.
Insofern kommen neue PDFs zwar unter Linux rein, werden aber vorzugsweise unter Windows betrachtet und eventuell bearbeitet (insbesondere, wenn der Inhalt komplexer ist).
Es handelt sich momentan um einzelne Aufsätze (also mehrere Seiten, auch nicht unbedingt zusammenhängend) aus zB 80-100-seitigen Magazinen in pdf-Form.
Meines Wissens kann man Linux-Applikationen unter einer Nachbildung einer Linux-Umgebung (bzw. Umsetzung der System-Aufrufe) unter Windows zum Laufen bekommen, ähnlich wie es umgekehrt mit Wine unter Linux mit Windows-Applikationen geht.
Ich kenne mich aber nicht mit den Details aus.

MfG
Zitieren
#4
Hi,

Du kannst Dir auf Deinem Windows-Rechner einen virtuellen Rechner installieren (mittels VM-Ware o.ä.). In diesem virtuellen Rechner kannst Du dann unter Windows ein Linux (und auch andere Betriebssysteme) laufen lassen.

Servus
der Michael
Tschüß
der Michael


.............................................
.......wie man's macht, iss nix......
.............................................
Zitieren
#5
Hallo Michael,

das ist mir 'ne Nummer zu groß...
Geht bestimmt auch etwas kleiner.

In der Zwischenzeit hab ich ein paar im Internet angebotene Windows-Tools probiert, die angebliches gleiches leisten.
Aber keines hat funktioniert...

MfG Kai
Zitieren
#6
Hallo Michael,mit diesem Programm geht das und noch viel mehr: http://www.pdf24.org/
und es kostet nix.
Gruß Jürgen
Zitieren
#7
Hallo Jürgen,

liege ich richtig mit der Annahme, daß es sich trotz des des anderen Namens um den Pseudo-Drucker-Treiber handelt, der früher unter "PDF Creator" firmierte ? Den hab ich auf mindestens einem meiner älteren Windows-XP Rechner. Geht, aber geht auch ohne so einen virtuellen Drucker, wie man eben am PDF-Shuffler sehen kann. Ich bleibe hartnäckig (manche sagen "stur") und möchte den Shuffler unter Windows 7 benutzen.

Wer weiß wie's geht ?

MfG Kai

PS.: Am Laufen hab ich jetzt gerade die Kombination aus qpdf (zur Freischaltung etwaiger Restriktionen) und PDFTK_Builder_Portable.
Geht "zur Not" auch, aber qpdf + PDF-Shuffler ist bequemer...

Nachtrag/Korrektur:
Inzwischen hab ich gemerkt, daß ich mit dem Verweis auf "mingw" daneben lag (Zeichen meiner Unwissenheit) und daß es wohl heißen müßte
"Wie kriegt man den PDF-Shuffler (oder andere Linux Apps) mittels Cygwin unter Windows (7) zum Laufen ?"
Zitieren
#8
Hallo Kai,

es kommt immer auf die Art der Anwendung an. Am einfachsten ist es natürlich, wenn ein offizieller Build für Windows zur Verfügung gestellt wird, wie z.B bei Gimp. Sowas habe ich für PDF-Shuffler auf Anhieb nicht gefunden - stattdessen aber wurde mir die Suche nach Alternativen zu PDF-Shuffler unter Windows vorgeschlagen. Scheint also eine Marktlücke zu sein Wink

MinGW ist sowas wie die Portierung des Compilers GCC nach Windows, mitsamt einiger GNU-Tools und Umgebung. Das spielt zwar beim Bauen von Windows-Versionen von Unix-Programmen eine große Rolle, ist aber wohl nicht, was Du suchst. Etwas näher ist vielleicht Cygwin (ähnlich wie Wine, glaube ich), aber davon habe ich fast keine Ahnung. Ich musste in den letzten 15 Jahren mich nur selten mit Windows arrangieren.

Speziell für den PDF-Shuffler: Laut Projektseite ist das Ding "written in Python using PyGTK". Damit brauchst Du theoretisch nur Python (gibt es unter Windows) und die Libraries, von denen er abhängt. Auf den ersten Blick wären das: GTK, PyPDF und Poppler. Letztere macht die PDF-Arbeit, und ist aber laut Wikipedia eher ein Unix/Linux-Gewächs. Diskussionen zu Windows-Versionen habe ich aber auch gefunden.

Also: Wenn Du basteln und was über Python und Linux lernen willst, wäre das eine spannende Bastelarbeit mit vielleicht 70% Erfolgsaussichten. Wenn Du aber vor allem ein das Ding unter Windows benutzen willst, such Dir lieber ein alternatives Tool.

Viele Grüße
Andreas


Nachtrag: Deinen Beitrag #7 habe ich erst nach Absenden gesehen/gelesen. Damit entfällt natürlich mein Hinweis, lieber ein Alternativprogramm zu suchen Wink
Zitieren
#9
Also, dann weiter, Du wolltest es ja so Big Grin

Cygwin ist laut Wikipedia "eine Kompatibilitätsschicht, die die Unix-API für verschiedene Versionen von Windows zur Verfügung stellt, auf deren Basis eine Vielzahl von Programmen aus der Unix-Welt unter Windows übersetzt werden kann." Die Idee ist also nicht, damit die binär für ein Linux erstellte Version 1:1 unter Windows laufen zu lassen, sondern als Entwickler auch eine Windows-Version davon bauen zu können. Als Anwender profitierst Du dann davon, dass sich jemand die Mühe gemacht hat, Dein Lieblingsprogramm auch unter Windows zu bauen - oder aber von einer Anleitung, die Dir selbst beim Compilieren jenes Lieblingsprogramms unter Windows hilft, nachdem Du Cygwin und/oder MinGW installiert hast.

Das gilt also im Wesentlichen für die "klassischen" Beispiele von Unix-Software, die überwiegend in C geschrieben ist. Auch hier wieder: PDF-Shuffler ist anders, weil er in Python geschrieben ist und damit nur recht indirekt vom Betriebssystem abhängen sollte. Damit steigen eigentlich Deine Chancen in diesem Fall!

Also, schauen wir doch mal genauer, der Code liegt ja offen:

Das Readme nennt folgende Abhängigkeiten:
Die Links zeigen auf den Python Package Index, aus dem man Libraries mit pip nachinstalliert (ähnlich wie Pakete in einer Linux-Distribution) - auch unter Windows. Nur bei Poppler steht neben "Operating System :: POSIX" nix mehr über Windows; das passt auch zu dem, was Wikipedia über Poppler sagt: "Entgegen seinem Mutterprojekt setzt Poppler nicht auf Plattformunabhängigkeit, sondern stattdessen auf gute Integration mit Unix-Betriebssystemen."

Also ist der Knackpunkt: Ist Poppler mit vertretbarem Aufwand unter Windows installierbar? Naja, es gibt ein passendes Projekt auf Sourceforge, und auch passende Diskussionen auf Stackoverflow. Naja, ein Ansatzpunkt wäre also da, jetzt gehts ans Ausprobieren. Trivial ist es nicht, und möglicherweise Zeitraubend. Ich würde hier wahrscheinlich aufhören.

Angenommen, Poppler ist verfügbar, bleiben nur noch kleinere Fallstricke: So werden z.B. im setup.py hemmungslos Unix-Shell-Befehle verwendet (z.B. "os.system ('rm -r mo/')") oder Unix-Pfadnamen vorausgesetzt ("install_dir = 'share/locale/%s/LC_MESSAGES/' % lang"). Das zeigt zumindest, dass der Autor nicht die Absicht hatte, weitergehend plattformunabhängig zu sein.

Frisch auf: Python für Windows installieren, mit pip die geforderten Libraries ziehen ("pip install PyGTK" und so weiter - natürlich ohne Windows-Netzzugang auch komplizierter), den Quellcode zu PDF-Shuffler runterladen, und zu starten versuchen. Fehlermeldungen anschauen, mehr Libraries installieren, iterieren.

Als ich noch Student war, hat es mir Vergnügen bereitet, ganze Nachmittage mit sowas zu verbringen. Inzwischen würde ich es nicht mehr versuchen, wenn die Not nicht groß genug ist.

Viele Grüße
Andreas

Wieder ein Nachtrag: Ich habe die Links aus der verlinkten Stackoverflow-Antwort mal durchgeklickt - der hier sah recht vielversprechend aus, um das Poppler-Problem zu lösen: Anscheinend gibt es einen Windows-Installer. Offenbar sind Poppler, PyGTK und PyGObject verwandt genug, um gemeinsam verpackt zu werden.
Zitieren
#10
Hallo Andreas,

vielen Dank für deine Erklärungsversuche.
Ich hatte gehofft, daß der PDF-Shuffler nur pypdf benutzt. Auf dessen Internet-Seite wiederum sah es so aus, als ob pypdf nur Original python benutzt.
Da gibt es auch ein Script-Beispiel zur Verwendung von pypdf sozusagen "zu Fuß" ohne das grafische Frontend PDF-Shuffler.
Aber dann ist wohl das schöne Feature der visuellen Seitenauswahl "futsch".
Insofern ist der Knackpunkt wohl der poppler, der vermutlich zur Seitendarstellung benutzt wird.
Ich habe gerade ein natives Windows-Programm namens PDF-Cutter ausprobiert.
Ist garnicht groß (Download ca. 1,6 MB, installiert ca. 5,5 MB). Braucht leider eine Seitenliste, wenn man nicht alle Seiten einzeln oder einen zusammenhängenden Bereich exportieren will. Aber in der Filebox beim Auswählen des zu bearbeitenden Files bekommt man vorübergehend alle Seiten angezeigt. Insofern gibt es unter Windows oder in einer Programm-DLL offenbar eine poppler vergleichbare Funktionalität.
Man bräuchte also eigentlich "nur eine kleine GUI" unter einem Windows-Compiler für pypdf "stricken" und sich schlau machen, wie man eine Seitenanzeige zustande kriegt, ohne zu tief in die Materie einsteigen zu müssen.

Wohl an denn, wer fühlt sich berufen...
MfG Kai
Zitieren
#11
Hallo Kai,

kaimex,'index.php?page=Thread&postID=202339#post202339 schrieb:Man bräuchte also eigentlich "nur eine kleine GUI" unter einem Windows-Compiler für pypdf "stricken" und sich schlau machen, wie man eine Seitenanzeige zustande kriegt, ohne zu tief in die Materie einsteigen zu müssen.

Ist der PDF-Shuffler nicht genau sowas? Er verwendet dazu nur eben nicht nur PyPDF. Insgesamt ist das Programm mit 1100 Code-Zeilen ja auch nicht riesig.

Einen Compiler brauchst Du zum GUI bauen eigentlich nicht - genau das macht ja das Toolkit (GTK+, ansonsten oft auch Qt oder andere) unabhängig von der Plattform, und noch dazu mit Python-Bindings auch in Python.

Wie oben im Nachtrag geschrieben - Poppler unter Windows sollte prinzipiell lösbar sein, wenn Du wirklich willst...

kaimex,'index.php?page=Thread&postID=202339#post202339 schrieb:Wohl an denn, wer fühlt sich berufen...

Hm, das fühle ich mich nicht: Windows und GUIs sind nicht so mein Ding...

Viele Grüße
Andreas
Zitieren
#12
Hallo Kai,
wenn Du noch ein Windows-Programm suchst sieh Dir mal PDFsam an http://www.pdfsam.org
Die basic version ist kostenlos. Ich nutze die ältere 2.2.2 Version die ist zwar etwas seltsam in der Bedienung aber macht ihren Job.
Java Runtime wird benötigt.
Gruß
Volker
Zitieren
#13
PDFsam wäre auch meine Empfehlung gewesen
Nutze ich seit vielen Jahren - das Ding kann alles was man so braucht
Viele Grüße
Jörg
Zitieren
#14
Hallo,

den PDFSam hab ich schon probiert, wenn ich mich recht entsinne, allerdings unter Linux.
Bei dem mußte wohl auch eine Liste der zu speichernden Seiten eingegeben werden.
Der PDF-Shuffler sticht dadurch hervor, daß man einfach durch den pdf-File scrollt und die ungewünschten Seiten per Click auf einen "Delete" Button entfernt und abschließend den "Rest" unter neuem Namen speichert. Man muß also nicht fehlerträchtig Seitennummern notieren und in eine Liste eintragen.
Unter Windows hab ich zuletzt ein paar PDFs von Ballast befreit mit der Kombination von qpdf (wenn erforderlich) und PDFCutter.
Da muß man allerdings auch eine Liste eingeben. Das Programm zeigt in der File-Open-Box sogar einen Preview mit Möglichkeit, durch den PDF-File zu scrollen. Es fehlt eigentlich nur noch die Funktionalität, Nummern gewünschter Seiten per Anclick in die Liste zu übernehmen. Leider kann man derzeit beim Scrollen nichts in die Liste schreiben. Ich erledige das deshalb nebenbei durch Schreiben in den Notepad und , wenn fertig, übertragen per copy/paste in das Listenfenster. Wenn ich wüßte, wie man unter Windows auf diesen PDF-Preview zugreifen kann, würde ich mich an die Programmierung einer kleinen GUI für pypdf unter Windows heranwagen.

MfG Kai
Zitieren


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste