PDF -> u ostale formate
Moderator/ica: Moderatori/ce
PDF -> u ostale formate
Ekipa,
koji mi program preporučate za konvertiranje PDF datoteka u Libre formate i ostalo
Tnx!
koji mi program preporučate za konvertiranje PDF datoteka u Libre formate i ostalo
Tnx!
- Abzeenth
- Site Admin
- Postovi: 6502
- Pridružen/a: 06 lip 2009, 23:16
- OS: Kubuntu & Fedora
- Lokacija: Online
Re: PDF -> u ostale formate
Ovisi kakav je izvorni PDF dokument.
Ako nije ne-OCR sken već je napravljen iz teksta (a to možeš testirati u pregledniku PDF dokumenata; ako se tekst normalno može selektirati i kopirati, onda je iz teksta), možeš ga konvertirati u obični TXT ili HTML pomoću pdftotext CLI alata - https://en.wikipedia.org/wiki/Pdftotext
Onda dalje taj TXT možeš uređivati u čemu god hoćeš.
Međutim, ako je PDF sken, odnosno napravljen "od slika" i nije OCR-an, bit će ga jako teško uređivati i rezultati vjerojatno neće baš biti zadovoljavajući. Inače, PDF dokumenti nisu namijenjeni za uređivanje i svakakvo "čačkanje"
; izvorno, to je format za prezentaciju te brzo i jednostavno dijeljenje dokumenata kod kojih je važno sačuvati formatiranje.
Ipak, postoje neke stvari koje možeš pokušati, ali ne mogu jamčiti da će uspjeti:
- koristiti neki besplatni OCR servis: uploadaš PDF, odabereš potrebne postavke i nadaš se najboljem
Recimo, ovaj: http://www.onlineocr.net/default.aspx
- koristiti PDF Import ekstenziju odnosno funkciju za LibreOffice (ne znam dolazi li to sad po defaultu u novim verzijama LO, nisam nikad koristila): https://www.libreoffice.org/features/extensions/
- otvoriti i pokušati urediti PDF s nekim "naprednijim" alatima tipa GIMP, PDF Edit (http://sourceforge.net/projects/pdfedit/) ili PDF Studio (vlasnički softver, ali postoji neka trial verzija za Linux, http://www.qoppa.com/pdfstudio/).
Možda će se još netko javiti s boljim idejama.
Ako nije ne-OCR sken već je napravljen iz teksta (a to možeš testirati u pregledniku PDF dokumenata; ako se tekst normalno može selektirati i kopirati, onda je iz teksta), možeš ga konvertirati u obični TXT ili HTML pomoću pdftotext CLI alata - https://en.wikipedia.org/wiki/Pdftotext
Onda dalje taj TXT možeš uređivati u čemu god hoćeš.
Međutim, ako je PDF sken, odnosno napravljen "od slika" i nije OCR-an, bit će ga jako teško uređivati i rezultati vjerojatno neće baš biti zadovoljavajući. Inače, PDF dokumenti nisu namijenjeni za uređivanje i svakakvo "čačkanje"
Ipak, postoje neke stvari koje možeš pokušati, ali ne mogu jamčiti da će uspjeti:
- koristiti neki besplatni OCR servis: uploadaš PDF, odabereš potrebne postavke i nadaš se najboljem
- koristiti PDF Import ekstenziju odnosno funkciju za LibreOffice (ne znam dolazi li to sad po defaultu u novim verzijama LO, nisam nikad koristila): https://www.libreoffice.org/features/extensions/
- otvoriti i pokušati urediti PDF s nekim "naprednijim" alatima tipa GIMP, PDF Edit (http://sourceforge.net/projects/pdfedit/) ili PDF Studio (vlasnički softver, ali postoji neka trial verzija za Linux, http://www.qoppa.com/pdfstudio/).
Možda će se još netko javiti s boljim idejama.
Re: PDF -> u ostale formate
Calibre.sandro je napisao/la:Ekipa,
koji mi program preporučate za konvertiranje PDF datoteka u Libre formate i ostalo
Tnx!
Re: PDF -> u ostale formate
Da, ima puno onlajn servisa za PDF koji su rađeni iz teksta, ali problem nastaje kada je PDF generiran kao slika
dali uopće postoji kakav program koji prepoznaje fontove na toj "slici" i tek ga onda prebaci u neku Libre/Office format?
Ja muku mučim sa nekim trial alatima, ali nikako da pronađem neki pravi program otvorenog koda
dali uopće postoji kakav program koji prepoznaje fontove na toj "slici" i tek ga onda prebaci u neku Libre/Office format?
Ja muku mučim sa nekim trial alatima, ali nikako da pronađem neki pravi program otvorenog koda
Re: PDF -> u ostale formate
trebao biti neki čisti ocr program koji su za to dizajnirani, ali rezultati njima nisu nikada 100%, a često su užasni. Ukratko, moje iskustvo je da jesa netrivijalnim dokumentima najbolje krenuti ručno prepisivat.
Es gibt keinen Gott, kein Universum, keine menschliche Rasse, kein irdisches Leben, keinen Himmel, keine Hölle. Es ist alles ein Traum - ein grotesker und dummer Traum. Nichts existiert außer dir. Und du bist nur ein Gedanke - ein vagabundierender Gedanke, ein nutzloser Gedanke, ein heimatloser Gedanke, der verloren in der leeren Ewigkeit wandelt!
Re: PDF -> u ostale formate
raditi će to netko drugi....
- ziko
- Postovi: 773
- Pridružen/a: 12 vel 2009, 12:12
- Spol: M
- OS: ovisi o danu u tjednu...
- Lokacija: Lošinj - Ljubljana...
Re: PDF -> u ostale formate
Mi smo na poslu koristili tj jos uvjek koristimo
Abby Fine reader http://finereader.abbyy.com/
program je vlasnički i kako vidim na stranici imaju verzije samo za Win i Mac, ali po mojim iskustvima prosao je tamo di je vecina besplatnih servisa pala.
Ljepo prepoznaje strukturu podataka (tablice, redovi, stupci i tako to) sto je super ako prebacujes u excel.
Sto se tice kvalitete prepoznavanja teksta, mene cudi da je uopce ista prepoznao jer su skenovi bili uzasne kvalitete.
Abby Fine reader http://finereader.abbyy.com/
program je vlasnički i kako vidim na stranici imaju verzije samo za Win i Mac, ali po mojim iskustvima prosao je tamo di je vecina besplatnih servisa pala.
Ljepo prepoznaje strukturu podataka (tablice, redovi, stupci i tako to) sto je super ako prebacujes u excel.
Sto se tice kvalitete prepoznavanja teksta, mene cudi da je uopce ista prepoznao jer su skenovi bili uzasne kvalitete.
Software is like sex... it's better when it's free
(Linus Torvalds quote)

Re: PDF -> u ostale formate
prije nego što bacim na install....
je trial verzija dovoljna za raditi?
je trial verzija dovoljna za raditi?
- ziko
- Postovi: 773
- Pridružen/a: 12 vel 2009, 12:12
- Spol: M
- OS: ovisi o danu u tjednu...
- Lokacija: Lošinj - Ljubljana...
Re: PDF -> u ostale formate
uh, neznam za trial verziju, pošto tu u firmi imamo original CD koji radi samo na jednom kompu, na ostale se instalira ali se nemoze pokrenut, jer preko neta provjerava onaj validation key tako d trial verziju nisam ni probavao...
Software is like sex... it's better when it's free
(Linus Torvalds quote)

- Abzeenth
- Site Admin
- Postovi: 6502
- Pridružen/a: 06 lip 2009, 23:16
- OS: Kubuntu & Fedora
- Lokacija: Online
Re: PDF -> u ostale formate
Za Windowse imaš i Readiris koji bi mooožda mogao raditi na Wineu. Ja sam to imala davnih dana na Windowsima, original naravno...mislim da sam ga dobila na nekom CD-u od printera/skenera, i on je super radio.
A možeš pogledati i ove prijedloge, to bi sve trebalo raditi na Linuxu, samo ne znam koliko su dobri: http://www.linuxlinks.com/article/20130 ... Tools.html
A možeš pogledati i ove prijedloge, to bi sve trebalo raditi na Linuxu, samo ne znam koliko su dobri: http://www.linuxlinks.com/article/20130 ... Tools.html