ChatGPT: Analyse von PDFs


Mit ChatGPT lassen sich nicht nur eingefügte Text analysieren, sondern auch PDFs. Hier liste ich drei Möglichkeiten auf. Spoiler: Die letzte finde ich am besten.

1. ChatGPT

Am einfachsten: ChatGPT anweisen, dass es ein Dokument analysieren soll, zum Beispiel (Prompt):

Fasse die Kernaussagen dieses PDFs zusammen:

https://www.bmwk.de/Redaktion/DE/Publikationen/Energie/photovoltaik-stategie-2023.pdf?__blob=publicationFile&v=6

Verlinkt ist hier die “Photovoltaik-Strategie” des Bundeswirtschaftsministeriums, erschienen am 10. März 2023.

ChatGPT erfasst per URL das PDF und liefert eine Zusammenfassung, die sich zwar gut lesen lässt, aber oberflächlich bleibt. Die erste Aussage “Bis 2023 soll der Anteil erneuerbarer Energien am Stromverbrauch auf 65 Prozent steigen” ist sogar schlicht falsch.

Auch auf die Nachfrage

“Welche Änderungen sind geplant bzgl. Balkonkraftwerke?”

liefert ChatGPT keine sinnvolle Antwort. Die Aussage “So dürfen Balkonkraftwerke beispielsweise nur noch eine maximale Leistung von 600 Watt haben” suggeriert, dass die zulässige Leistung eines Balkonkraftwerks neuerdings nur noch 600 Watt betragen darf. Das Gegenteil stimmt aber: Im Strategie-Papier zur Photovoltaik wird eine Leistungssteigerung auf 800 Watt vorgeschlagen.

2. ChatPDF

Vor kurzem hat ChatGPT eine Schnittstelle (API) veröffentlicht. Seitdem können auch Drittanwendungen auf ChatGPT zugreifen, zum Beispiel die Website ChatPDF. Hier lassen sich per Dateiupload oder auch URL PDFs hochladen. Sie werden analysiert, es beginnt eine Konversation zwischen User/in und PDF:

Das Besondere hierbei: ChatPDF liefert automatisch eine kurze Zusammenfassung des Inhalts im PDF sowie Beispiel-Fragen, die per einfachem Mausklick gestellt werden können. ChatPDF ist also nicht nur eine Möglichkeit, die Inhalte eines PDFs zu erfassen, sondern gleichzeitig eine Art Prompt-Generator.

Die Fragen sind sinnvoll. Allerdings sind die Antworten in diesem Beispiel tendenziell nicht zu gebrauchen.

Auf die Anweisung

“Nenne konkrete Maßnahmen, die bzgl. der Balkonkraftwerke in Erwägung gezogen werden.”

folgt die Antwort: “In der Photovoltaik-Strategie des BMWK werden keine spezifischen Maßnahmen für Balkonkraftwerke genannt.” Stimmt aber nicht.

3. Corpora

Auch beim Service Ask Corpora lassen sich PDFs hochladen und analysieren. Corpora beantwortet Fragen und befolgt Anweisungen. Im Test mit dem PDF “Photovoltaik-Strategie” hat Corpora die besten Antworten geliefert und auch auf die Frage nach konkreten Maßnahmen bzgl. der Balkonkraftwerke korrekt geantwortet.

Eine Besonderheit ist: Corpora liefert nicht nur KI-generierte Antworten, sondern listet auch auf, auf welcher Seite im PDF die Informationen auftauchen, die für die Antwort genutzt wurden. Ein nützlicher Service.

Etwas hinderlich ist, dass sich die Anfragen in Corpora teilweise auf alte PDFs beziehen, die eigentlich schon gelöscht sind. In dem Fall muss man in der Anfrage (im Prompt) den Dateinamen des neu hochgeladenen PDFs angeben. Dann funktioniert es.

Selbstverständlich ist das kein repräsentativer Test, sondern eher ein erster Eindruck. Von ChatGPT generierte Antworten unterscheiden sich, selbst bei identischen Anfragen/Prompts.

Und wie immer gilt: ChatGPT ist nicht fehlerfrei und liefert allenfalls Hinweise, mit denen sich weiterarbeiten lässt.

Ich nutze die Analyse von PDFs durch ChatGPT dann, wenn ich mich selbst im Thema auskenne und über Kontextwissen verfüge.


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert