[personal profile] veliss
Копирую из pdf в wоrd текст через буфер обмена. Слетает кодировка. Цифры видно, а вместо буковок - квадратики.
Оно, конечно, эстетично и ничошно, но хотелось бы текст.
Это лечится? Или не судьба?

тут без бубна не обойтись

Date: 2015-10-19 09:25 am (UTC)
From: [identity profile] chabapok.livejournal.com
Надо понять, какой шрифт использован в pdf и поставить его в систему.

Можно попытаться выделить все и дать ему существующий шрифт.
From: [identity profile] veliss.livejournal.com
я в адобе про шрифты вообще ничего не вижу :(
From: [identity profile] chabapok.livejournal.com
где-то в свойствах pdf.
или hexeditor в руки, и там поискать слова похожие на название шрифта.
From: [identity profile] zadunai-sky.livejournal.com
Скорее всего мой коммент уже не актуален, но в качестве факультатива: проблемный pdf-документ, вероятнее всего, верстался с экзотическими шрифтами. Бывают "умники" использующие шрифты в "инопланетной" кодовой странице (сейчас, слава Богу, такие не используются).
Как собственно Acrobat их читает не представляю -- скорее всего необходимые шрифты встроены в документ и "Акробат" сам их умеет отображать. А вот, отдавая данные в буфер обмена, он передает коды символов не соответствующие нормальной кодовой странице. На выходе получается мусор.

+ к совету комментатора ниже, если крайняя необходимость остается
1. открыть документ в текстовом редакторе (notepad, notepad++),
2. попытаться узнать название шрифта -- где-то в заголовках документа он определен
3. найти в интернетах данный шрифт и установить на компьютер.
После этого будет копироваться нормальный текст. Ну или по крайней мере pdf можно будет конвертировать в текст.

Разобраться, где в pdf документе определяется шрифт -- это тоже еще та проблема. Pdf -- это модифицированный PS-формат, используемый как набор команд для печати принтером. Все команды текстовые в ACSII кодировке (Хотя бинарники тоже могут встраиваться. Например, те же шрифты и графические изображения). Поэтому все вполне читабельно обычным блокнотом. Только не пытайтесь открыть Word'ом!

PS Удачи. Еще вариант использовать распознавалку текста: пиратский FineReader, или отечественный (??? Россия) бесплатный cuneiform.
Edited Date: 2015-12-06 09:21 pm (UTC)

Date: 2015-10-19 09:31 am (UTC)
From: [identity profile] radolini.livejournal.com
Конвертируйте, а не копируйте. Или распознайте.

Date: 2015-10-19 09:41 am (UTC)
From: [identity profile] veliss.livejournal.com
сконвертировала каким-то онлайн конвертером. выкинул результат в докс. там остались цифры и знаки препинания. текста нету :)

Date: 2015-10-19 09:43 am (UTC)
From: [identity profile] radolini.livejournal.com
Выкиньте, значит ;)) Пришлите мне файл.

Date: 2015-10-19 09:46 am (UTC)
From: [identity profile] veliss.livejournal.com
не могу :( внутренняя аналитика.

придётся текст руками ....

пошла вешаться.

Date: 2015-10-19 10:09 am (UTC)
From: [identity profile] radolini.livejournal.com
А распознать-то не судьба что ли?

Date: 2015-10-19 10:19 am (UTC)
From: [identity profile] veliss.livejournal.com
ну эм.... нужно где-то найти халявную распознавалку, скачать, установить.... а я всё-таки блондинка - у меня лимит на подумать дневной исчерпан.

Date: 2015-10-19 10:27 am (UTC)
From: [identity profile] radolini.livejournal.com
Полагаю, до запроса "finereader бесплатный аналог" блондинка должна суметь додуматься.

Или это. Calibre качните. Мож полегчает. Оттуда в rtf зафигачите. Или конвертируйте тем, чем вы там пользуетесь, в голый текст. Короче, вариантов море. Впрочем, хотите - набирайте ;)) Если вам это проще, чем подумать.

Date: 2015-10-19 10:42 am (UTC)
From: [identity profile] veliss.livejournal.com
блондинка даже такие названия слышит впервые :)
сейчас качну

Date: 2015-10-19 09:32 am (UTC)
From: [identity profile] catodon.livejournal.com
Попробуйте в Ворде вставить текст, используя контекстное меню (правая кнопка мышки). Там будет три варианта: "вставить с оригинальным форматированием", "подстроить под документ" и "вставить только текст". Попробуйте 3-й вариант.

Date: 2015-10-19 09:42 am (UTC)
From: [identity profile] veliss.livejournal.com
у меня только одна "вставить" :)
старый офис?

Date: 2015-10-19 09:46 am (UTC)
From: [identity profile] catodon.livejournal.com
В старом Офисе после вставки в конце вставленного текста появляется маленькая иконка с маленькой стрелочкой вниз. На стрелочку можно нажать и выбрать те же варианты вставки (см. выше).

Date: 2015-10-19 09:54 am (UTC)
From: [identity profile] veliss.livejournal.com
ага, нашла. буду знать. только не помогло
те же эстетичные квадратики

Date: 2015-10-19 10:03 am (UTC)
From: [identity profile] catodon.livejournal.com
Защищенный документ?

Date: 2015-10-19 10:17 am (UTC)
From: [identity profile] veliss.livejournal.com
вроде нет. но я так глубоко фен-шуй не знаю :)

Date: 2015-10-19 09:34 am (UTC)
From: [identity profile] mr-quietest.livejournal.com
Нет шрифтов, использованных в документе PDF

Date: 2015-10-19 09:40 am (UTC)
From: [identity profile] a-v-k-73.livejournal.com
Kak uzhe pravil'no soobschili, v sisteme nema shrifta, kotoryj ispol'zovan v pdf, i/ili v pdf nestandartnaya kodirovka shrifta. Poprobuj drugoj pdf viewer, tipa sumatraPDF --mozhet, prokanaet.

Date: 2015-10-19 09:44 am (UTC)
From: [identity profile] veliss.livejournal.com
я уже попробовала два вьювера и три конвертера.
боюсь, за это время могла бы набрать текст руками.
но мы же не ищем лёгких путей))))

Date: 2015-10-19 09:56 am (UTC)
From: [identity profile] a-v-k-73.livejournal.com
Poprobuj esche sdelat' paste sperva v notepad, i ottuda -- w word. Esli ne, to luchshe zabit' bolt :)

Date: 2015-10-19 09:58 am (UTC)
From: [identity profile] veliss.livejournal.com
квадратики!
я к ним уже привыкла ))))

Date: 2015-10-19 09:59 am (UTC)
From: [identity profile] veliss.livejournal.com
􀉄􀉨􀉧􀉤􀉭􀉪􀉟􀉧􀉬􀉧􀉿􀀃 􀉩􀉟􀉪􀉟􀉜􀉚􀉝􀉢􀀃 􀉬􀉚􀀃 􀉨􀉛􀉦􀉟􀉠􀉟􀉧􀉧􀉹􀀃 􀉩􀉟􀉪􀉫􀉩􀉟􀉤􀉬􀉢􀉜􀉧􀉨􀉝􀉨􀀃 􀉪􀉨􀉡􀉜􀉢􀉬􀉤􀉭􀀃

Date: 2015-10-19 09:54 am (UTC)
From: [identity profile] eto kak (from livejournal.com)
Попробуйте перед копированием переключиться на тот язык на котором набран копируемый текст.
Так же попробуйте его вставить не сразу в ворд, а сначала в Блокнот.

Date: 2015-10-19 09:56 am (UTC)
From: [identity profile] veliss.livejournal.com
квадратики :(

Date: 2015-10-19 10:36 am (UTC)
From: [identity profile] eto kak (from livejournal.com)
Попробуйте в Акробате - Меню Файл - сохранить как - текст

Date: 2015-10-19 10:41 am (UTC)
From: [identity profile] veliss.livejournal.com
цифры и знаки препинания...

Date: 2015-10-19 01:40 pm (UTC)
From: [identity profile] chabapok.livejournal.com
вместо промежуточного блокнота используйте notepad++. Там есть кодировки, с ними поиграйтесь.

Date: 2015-10-19 10:04 am (UTC)
From: [identity profile] kyty3ob.livejournal.com
Ксю, а чем пдф смотришь?
Акробат, ридер и сторонний софт могут давать совершенно разные результаты.
Сторонний софт, кстати, умеет дофига гитик.
СуматраПДФ, ФокситРидер - пробовала? Бесплатные.

В прошлых версиях акробата была такая же история при печати - квадратики и цыферки. Лечилось выставлением галки "печатать как картинку". В старших версиях пропало и то и другое - и бага и фича. Сторонние читалки, кстати, подобного глюка не имели. Так что настоятельно рекомендую. Ну на крайняк - распознать картинку, но это не по фэн-шую...

Date: 2015-10-19 10:18 am (UTC)
From: [identity profile] veliss.livejournal.com
где скачать стороннюю читалку не знаешь? :)

Date: 2015-10-19 11:21 am (UTC)
From: [identity profile] hallergrid.livejournal.com
выдели квадратики и поменяй шрифт на стандартный системный, типа ариала. Будет все ок.

Date: 2015-10-19 11:59 am (UTC)
From: [identity profile] veliss.livejournal.com
нифига не ок :(

Date: 2015-10-19 12:37 pm (UTC)
From: [identity profile] hallergrid.livejournal.com
хм. странно ;-( Обычно помогает. У меня было такое.
А если в существующий набранный и хорошо читаемый текст рядом без пробела ткнуть курсором и вставить? Он по идее должен воспринять форматирование документа в который добавляется текстовый блок.

Date: 2015-10-19 02:08 pm (UTC)
From: [identity profile] veliss.livejournal.com
не-а. квадратики
я уже злюсь)))

Date: 2015-10-21 10:23 am (UTC)
From: [identity profile] hallergrid.livejournal.com
хм ( А если не в Ворд копировать скажем, а в письмо или в нотпад, или в браузер, например, в гугл переводчик скопировать? То же?

Date: 2015-10-21 10:27 am (UTC)
From: [identity profile] hallergrid.livejournal.com
скинь ПДФ посмотреть, скорее всего в нем проблема. sergey"Собака"op.pl

Date: 2015-10-19 05:14 pm (UTC)
From: [identity profile] gringo36.livejournal.com
Ну и как решилась проблема?

Date: 2015-10-20 03:47 pm (UTC)
From: [identity profile] gringo36.livejournal.com
Через недельку вернусь, если интересно, можно решить проблему. На будущее.

Date: 2015-10-21 07:55 am (UTC)
From: [identity profile] veliss.livejournal.com
спасибо :)

Date: 2015-10-19 05:52 pm (UTC)
From: [identity profile] nepeanois.livejournal.com
копируйте через блокнот. который простой без форматирования

Date: 2015-10-20 09:08 am (UTC)
From: [identity profile] veliss.livejournal.com
копировала. квадраты

Date: 2015-10-19 06:09 pm (UTC)
From: [identity profile] Андрей Григорьев (from livejournal.com)
Finereader решит вопрос.
http://www.ex.ua/87662501 как вариант.

Date: 2015-10-20 08:03 pm (UTC)
From: [identity profile] no more turtles (from livejournal.com)
можете попробовать если доверяете: http://www.pdfunlock.com/
Page generated Jul. 23rd, 2017 10:44 pm
Powered by Dreamwidth Studios