Pytanie:
Oprogramowanie, które może wyodrębniać tabele z plików PDF
user1605665
2016-06-30 04:52:54 UTC
view on stackexchange narkive permalink

Często otrzymuję dane tabeli w plikach PDF. Chcę mieć możliwość przeniesienia tego do MS Excel w formacie tabelarycznym, ale często wychodzi to dziwnie, kiedy kopiuję i wklejam.

Chcę mieć możliwość przenoszenia tabel z PDF do MS Excel, gdy utrzymanie ich struktury.

Jeśli odpowiedź była dla Ciebie pomocna, rozważ oznaczenie jej jako [zaakceptowanej odpowiedzi] (http://softwarerecs.stackexchange.com/help/accepted-answer), aby inni mogli łatwiej ją znaleźć w przyszłości. Jest to również uprzejmy sposób, aby podziękować osobie odpowiadającej na Twoje pytanie za pomoc.
Cztery odpowiedzi:
Andrea Lazzarotto
2016-06-30 05:12:49 UTC
view on stackexchange narkive permalink

Użyj pdftables.com.

Przykładowe dane wejściowe:

sample input

Dane wyjściowe :

output

https://www.pdftoexcelonline.com/ również działa.
@LShaver niezły! Powinieneś zamieścić to jako odpowiedź. :)
claws
2016-07-22 22:51:15 UTC
view on stackexchange narkive permalink

ABLE2EXTRACT PDF CONVERTER robi to doskonale. Możesz sprawdzić wideo demonstracyjne na ich stronie. To, co uwielbiam w tym oprogramowaniu, to (i myślę, że jest ono wyjątkowe tylko dla tego produktu):

  1. Możesz po prostu wybrać obszar ze strony (w naszym przypadku tabeli) w pliku PDF i zapytać to do konwersji.
  2. Podczas konwersji daje nam dwie opcje: Automatyczną lub Ręczną (po prostu uwielbiam to). Możemy pokierować oprogramowaniem w rozpoznawaniu odpowiednich kolumn i wierszy tabeli.
  3. Po konwersji zajmuje się również formatowaniem liczb.

Mają darmowe konwerter online również dla zwykłych użytkowników. Oto przykład:

Na stronie PDF: enter image description here

Po automatycznej konwersji: enter image description here

Ryan
2016-07-01 01:47:32 UTC
view on stackexchange narkive permalink

PDFGenie może Cię zainteresować.

Ten post na blogu zawiera bardziej szczegółowy opis produktu.

Przykład dane wejściowe i wyjściowe znajdują się w pobieraniu.

Dane wyjściowe to XHTML, więc musiałbyś wykonać pewne przetwarzanie końcowe, aby uzyskać coś, co możesz przesłać do programu Excel.

skeith
2016-06-30 08:34:33 UTC
view on stackexchange narkive permalink

Spróbuj użyć Foxit PhantomPDF. Uważaj jednak, jeśli plik PDF zawiera tekst poza tabelą, zostanie wyrównany do lewej.

Oto wynik

enter image description here

Czy mógłbyś dodać próbkę wejścia / wyjścia, jak w odpowiedzi Andrei? Dzięki!


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...