[Проблема] Регулярные выражения Notepad++

TAFF
На сайте с 28.08.2008
Offline
140
8110

Здравствуйте! Есть список сайтов, ссылки вида:


http://geopolis.com.ua/spring2009/200-sokrovishha-imperii-daty-vyezdov-28.07-15.08.html

Необходимо порезать всё что после зоны домена (в данном случае .ua)

Как это можно сделать с помощью регулярных выражений Notepad++?

Ps: оффсайт читал, так и не понял как убрать всё что после X символа(ов)

✓ Администрирование (/ru/forum/494299) | ✓ Домены (/ru/forum/298049) | ✓ Продажа аккаунтов narod.ru (/ru/forum/585347)
BlackvsEvgen
На сайте с 21.08.2009
Offline
74
#1

ну как я понял

тебе надо провести замену , разбирайся тс ней Ctrl+H

Любимый хостинг (http://bit.ly/VW9SbN) | Постовые для вашего сайта (http://bit.ly/WPm6Et)
TAFF
На сайте с 28.08.2008
Offline
140
#2

BlackvsEvgen, с ней и пытаюсь разобраться. Цель - в каждой строчке убрать все что после символа(ов) X до конца строки

T.R.O.N
На сайте с 18.05.2004
Offline
314
#3

TAFF, а не быстрее все кинуть в Excel? У него куча текстовых функций которые очень качественно работают

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
wdsg
На сайте с 09.02.2009
Offline
31
#4

Если в этом самом Notepad++ реализованы общепринятые правила RegExp, то:

\.ua.*$

необходимо заменить на '.ua'.

Проектирование и разработка сложных IT-систем. Вожусь с проблемными задачами.
TAFF
На сайте с 28.08.2008
Offline
140
#5
T.R.O.N:
TAFF, а не быстрее все кинуть в Excel? У него куча текстовых функций которые очень качественно работают

Буду благодарен если скините пример :)

wdsg:
Если в этом самом Notepad++ реализованы общепринятые правила RegExp, то:
\.ua.*$

необходимо заменить на '.ua'.

Спасибо, всё работает ☝ Но доменных зон слишком много, как бы заменить всё одним махом :(

T.R.O.N
На сайте с 18.05.2004
Offline
314
#6

TAFF,

функция ПОИСК() возвращает позицию результат а потом обрезаете до этого символа с помощью ЛЕВСИМВ()

wdsg
На сайте с 09.02.2009
Offline
31
#7

Попробуйте

#(\.ru|\.ua|\.com\.ua|\.com|\.ещё_домен_1-го_уровня).*$#

заменить на '$1'.

В список доменов первого уровня добавьте все домены, которые имеют место быть в Вашем списке.

R
На сайте с 30.12.2007
Offline
38
#8

Удалите все http://

и можно убирать всё, что после слеша этим:

/.*$
S
На сайте с 13.07.2007
Offline
56
#9

Можно наверное и так


$url =~ m/^(.*?\..*?[\/?]).*$/gi;

print $1;

или если есть всегда протокол:// , то можно

$url =~ m/^(.*?\/\/.*?[\/?]).*$/gi;


print $1;
TAFF
На сайте с 28.08.2008
Offline
140
#10
rearranger:
Удалите все http://
и можно убирать всё, что после слеша этим:
/.*$

Самое простое решение, спасибо 🍾

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий