вероятно иностранкаПохоже, что это эксплорерный перевод с английского на русский фрагмента этой статьи:
http://indesignsecrets.com/using-grep-to-m...r-lowercase.php
Любимцев
Feb 24 2010, 17:52
Забавно... А выглядит, как от первого лица. И даже просит ответить, что в итоге получилось
vbatushev
Mar 5 2010, 13:26
Соорудили мы тут с romvits запрос.
Задача: необходимо находить закавыченный «елочками» текст для последующей замены оных «елочек» на другие кавычки. Причем и тот текст, где встречаются разрывы строк и абзацев.
Результат:
(«)(.+?([\r\n].+?)*)(»)
yann777
Mar 9 2010, 18:25
Доброе время суток.
Есть задача: найти (и потом удалить) любые символы находящиеся между временем (12.00 или 7.35) и первой открывающей кавычкой («). Долго мне это не давалось, grep всё норовил схватить все символы до последней кавычкой. Казалось бы это (?<=\.\d\d).+(?=«) должно работать. Ан нет!
В общем пришел к этому - (?<=\.\d\d)[А-я, ]+(?=«). В конструкцию [А-я, ] можно добавлять по необходимости точку, A-z и др.
vbatushev, если в цитате (закавыченный «елочками» текст) находиться название фирмы (ООО «Вася»), то («)(.+?([\r\n].+?)*)(») находит от начала цитаты до конца названия фирмы. Или я не прав?
Спасибо всем дочитавшим до конца.
putnik
May 26 2010, 08:20
На сайте
www.abracadabrapdf.net нашелся файл JSFindChangeList.txt к скрипту FindChangeByList, для чистки текста в соответствии с правилами французской типографики. zip 350 kb. Может, кому-то пригодится.
S_Troitskaya
Aug 25 2010, 18:23
Прошу помощи. У самой никак не получается.
Имеется абзац такого вида: "Иван ПУПКИН vanya@mailx.ru" или "Материал полосы подготовил Иван ПУПКИН vanya@mailx.ru". Все что до адреса - жирно 7 кеглем, сам адрес нормально и 6 кеглем.
Создала сивмольный стиль, описывающий форматирование адреса. Как его включить в стиль параграфа? Чувствую, что через GREP должно получиться... Но не знаю как
vbatushev
Aug 26 2010, 10:53
([А-я]+ ){2}[a-z\.\-_]+@([a-z\-_]\.?)+\s*$
"Набор кириллических символов любого регистра, заканчивающийся пробелом, встречающийся два раза, за которым идет набор латинских символов нижнего регистра, в который включены символы точки, подчеркивания и дефиса, после которого идет @, за которым следует любое количество наборов из латинских символов (плюс дефис и подчеркивание), заканчивающихся точкой, после всего этого до конца строки может встретиться пробелы (или пробелы)"
Как-то так
S_Troitskaya
Aug 26 2010, 13:18
Спасибо большое! Все получилось.

Для применения моего символьного стиля мне понадобилась только латинская часть этого выражения.
vbatushev
Aug 26 2010, 14:45
Ага, немного не так понял. Ну, хорошо, раз получилось
TapakaH
Sep 2 2010, 17:03
Всем привет!
Подхелпите пожалуйста c заменой:
найти "ул. + много символов на рус. с пробелами пока не встретится ,"
заменить на "много символов на рус. с пробелами+ул"
т.е. ул. Ивана Федорова, д. 12 заменить Ивана Федорова ул., д. 12
TapakaH
Sep 3 2010, 08:19
В моем случае простая замена подойдет
1. "ул." заменить на "пробел"
2. ", д." заменить на "ул., д."
3. и убрать двойные пробелы
vbatushev
Sep 3 2010, 11:11
Искать:
(ул\.)( +)(.+?),
Заменять:
$3 $1,
Хто в курсе про поиск конца строки (перевод каретки). GREP в InDesign СS 3 не выдает (Символ перевода каретки). А если символа нет, а надо искать по концу строки?
Тож касается поиска переносов, которые расставляются автоматически. Например, задача: проверить все переносы, которые понаставляли пиндосовские автоматы переносов, на соответствие правил переноса в русском языке?
Цитата(vbatushev @ Feb 21 2010, 08:03)

Я уж не говорю про включение регистронезависимости, чтобы не писать такой длинный запрос как у Алексея.
Я же верно понял, что речь идёт
вот об этом моём примере? Неа, Виталик, включение регистронезависимости тут не годится. Потому что у меня не все слова дублируются в обоих регистрах. Например, я вижу смысл в неразрывном символе после некоторых коротких слов, не являющихся предлогами: "Их", "Да", "Ну", "Уж", "Эх"... (только в строгой книжной вёрстке с широкой полосой набора!!) — но не вижу смысла прилеплять их в нижнем регистре, т.е. в середине предложения. Так что твоя неправда.
Не знаю, было ли, не следил. Скрипт для расшифровки GREP-выражений поиска (не замены) на человеческий английский:
http://adobeindesign.ru/2010/04/11/rasshif...rep-vyrazhenij/
Неразрывный пробел между именами царей/королей и их "нумерацией". Find what: (?<=[а-я])\s(?=(?-i)[I|V|X]+\b(?!(\sвек|\sстолет|\sв\.|\sвв\.|~=|~_|-|~~)))
Найти пробел, если ему преждествует строчная кириллическая буква и если после этого пробела следует любое сочетание латинских символов верхнего регистра I, V или X, которое является *одним словом*, но после этого сочетания не должно быть сочетаний "пробел+век*", "пробел+столет*", "пробел+сокращение в. или вв.", а также короткого или длинного тире и обычного или неразрывного дефиса (тире исключат диапазоны веков, а дефисы отсеют комбинации с наращениями типа "VI-я эскадрилья" или "в XVII-м веке" — пусть они и корявые, но встречаются).
Change to: ~S
Обычный неразрывный пробел. Если кому-то вдруг понадобится зауженный пробел, это тоже можно сделать. Именно поэтому в условии задан поиск только пробела, а не более сложных сочетаний.
Результат на примере текста-"рыбы". Красные выражения пропускаются, синие обрабатываются:
Вереница дворцов, украшенных колоннами, лепниной и эркерами, переносят нас в атмосферу XIX–XX веков. История этого городка восходит к XVIII столетию (по другим версиям, к XVII-му). В свое время здесь отдыхали императоры Вильгельм I, Вильгельм II и Карл X.Примечание.Эта замена оттачивалась на географическо-историческом журнальчике. В итоге я включил её в Правила в "сезаме" Батушева. Однако я не могу гарантировать результат в специальных текстах, где попадаются технические обозначения с использованием римских цифр. Поиск строился из предположения, что римские цифры — это либо имена, либо столетия.
Улучшения, замечания и отзывы приветствуются.
Это текстовая версия — только основной контент. Для просмотра полной версии этой страницы, пожалуйста,
нажмите сюда.