Меню

3 способа вытащить текст из PDF-файлов или конвертируем PDF формат

Приветствую!

Рассмотрев ранее, как можно создавать PDF-документ, разными способами: и онлайн, и оффлайн и даже средствами Microsoft Office, пришло время рассказать, как произвести обратное действие.

Преобразование PDF в Word

Рассмотрим, как вытащить из PDF-документа текст, так чтобы можно было потом его редактировать в Word и подобных ему текстовых редакторах. То есть, попросту говоря, будем конвертировать PDF-файлы в Word.

Начнем!

Adobe Reader и аналоги

Самый простой, быстрый и бесплатный вариант:
Открываем нужный PDF-документ в Adobe Reader. Заходим в меню Редактировать, потом выбираем команду “Копировать файл в буфер обмена”

adobe

 

А дальше, стандартные действия: открываем Word, создаем новый документ и нажимаем кнопку Вставить или воспользуемся быстрыми клавишами (Ctrl+V).

adobe1

Все, можно спокойно редактировать полученный текст.

Обратите внимание, при использовании данного метода не сохраняется форматирование текста и нет возможности вытащить изображения!!! 

Если вам, все таки, во что бы то ни стало нужно извлечь изображение из PDF-документа, чтобы не использовать какие-нибудь программы, сделайте скриншот с экрана на котором открыт PDF-файл, из которого вы скопировали текст, но не получилось скопировать картинку.

adob2

 

И полученное изображение вставьте в Word. Должно получиться вот так:

adob4

Понятно, что качество изображения будет оставлять желать лучшего, но как запасной вариант вполне подойдет.

В других просмотрщиках нужно будет сделать несколько иное действие.

Вот так в Foxit Reader (меню инструменты –> команда Выделить текст):

adob5

А вот так в PDF-XChange Viewer (меню Инструменты –> Основные –> Выделение):

adob6

Затем выделяем нужный текст и производим стандартные действия с буфером обмена, для тех кто не догадался: Копировать (Ctrl+C) и в Word — Вставить (Ctrl+V).

к меню

Система оптического распознавания текста (OCR)

При всей прелести этой методики у нее есть недостаток. Конвертировать PDF в Word не получиться, если PDF-документ создан сканированием с бумажного носителя или защищен от редактирования.

Поэтому будем использовать другой метод. А имено, с помощью специальной программы оптического распознавания текста.

Программа называется ABBYY FineReader и, к сожалению, является платной. Но зато функционал этой программы позволит перекрыть любые требования по созданию и конвертированию PDF-файлов.

Вот, например, имеем отсканированный текст в PDF формате

adob8

Запускаем ABBYY FineReader и в стартовом окне выбираем Файл в Microsoft Word

adob7

И все! Система сама распознает текст и отправляет его в Word

adob10

adob11

к меню

Онлайн-сервисы для конвертирования PDF-файлов

Вариант с онлайн-сервисами я уже описывал, единственно, что могу добавить еще пару подобных сервисов:

PDF to Word Converter

adob12

ExtractPDF.com

adob13

И опять же, ни один из онлайн-сервисов не работает с изображениями, и если  текст у вас отсканирован и  сохранен в формате PDF, то ничего не получится. Необходимо будет рассматривать вариант OCR.

к меню

Резюмируем

Как обычно, самым удобным оказался платный вариант, но остальные имеют право на существование, потому что не каждый день требуется преобразовывать файлы PDF. А на один раз можно или скачать демо-версию или воспользоваться онлайн-сервисом.

Если нельзя, но сильно надо, то способ всегда найдется.

Да, и еще, если Вы знаете еще какой-нибудь способ преобразования PDF-файлов, напишите мне в комментариях.

Спасибо за внимание!

Всегда ваш, Абрамович Артем!

P.S. Лирическое отступление:

Сижу расстроенная, подходит мелкий брат, суёт конфетку, я ему говорю:
— Дима, у меня взрослые проблемы, и этим их не решить.
Через 5 минут приходит с бутылкой мартини и спрашивает:
— А этим?
* * *

Ребенок (2 года) в парке увидел близнецов. Долго и удивленно их разглядывал. Поворачивается к маме и с нажимом спрашивает:
— А где мой такой?!

* * *
Еду в трамвае. За моей спиной сидит девочка, лет пяти. Она у окна, а рядом её мама. Девочка:
— Мам, а мам, а зачем реклама на сидениях — хочешь, скажу? Ну, вот скажи, хочешь? Ты только спроси — я тебе сразу скажу, я все тебе объясню, расскажу. Ты знаешь, зачем это? Ну, чего ты молчишь? Ну, спроси меня, давай!!!
Мама не выдерживает:
— Ну и зачем?
— Чтоб дети в трамваях читали… А не задавали взрослым глупые вопросы

Поддержи проект лайком
Метки: ,
48 комментариев
  1. polivaka / Ответить
    • Абрамович Артем / Ответить
      • Никита / Ответить
        • Абрамович Артем / Ответить
  2. Александр / Ответить
    • Абрамович Артем / Ответить
  3. Александр / Ответить
    • Абрамович Артем / Ответить
  4. Liana / Ответить
    • Абрамович Артем / Ответить
  5. Тим / Ответить
    • Абрамович Артем / Ответить
  6. Ксения / Ответить
    • Абрамович Артем / Ответить
  7. Александр / Ответить
    • Абрамович Артем / Ответить
      • Александр / Ответить
        • Абрамович Артем / Ответить
  8. Аня / Ответить
    • Абрамович Артем / Ответить
  9. Sima / Ответить
    • Абрамович Артем / Ответить
    • Абрамович Артем / Ответить
  10. Sima / Ответить
    • Абрамович Артем / Ответить
  11. Анастасия / Ответить
    • Абрамович Артем / Ответить
  12. Рина / Ответить
    • Абрамович Артем / Ответить
      • Рина / Ответить
        • Абрамович Артем / Ответить
  13. Руслан / Ответить
    • Абрамович Артем / Ответить
  14. Руслан / Ответить
  15. Николай / Ответить
    • Абрамович Артем / Ответить
  16. Николай / Ответить
    • Абрамович Артем / Ответить
  17. Мирина / Ответить
    • Абрамович Артем / Ответить
  18. Ирина / Ответить
    • Абрамович Артем / Ответить
      • Олег / Ответить
        • Абрамович Артем / Ответить
  19. Яна / Ответить
    • Абрамович Артем / Ответить
  20. Алексей / Ответить
    • Абрамович Артем / Ответить

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Подписка на новости

Подписка на новости

Хотите первым узнавать о новостях? Тогда подписывайтесь!

Спасибо за подписку! Теперь вам надо подтвердить ее.