Модуль:Delink
Зовнішній вигляд
Документація модуля[перегляд] [редагувати] [історія] [очистити кеш]
Цей модуль позначено як К:такий, що потребує захищеного статусу (66). Завершені модулі використовуються в дуже великій кількості статей, або часто використовуються як підстановки. Позаяк акти вандалізму або помилки можуть вплинути на багато сторінок і навіть незначне редагування призведе до істотного навантаження на сервери, вони підлягають захисту від редагувань. |
Цей модуль Lua використовується в системних повідомленнях і на близько 220 000 сторінках. Його зміни можуть призвести до миттєвих змін у користувацькому інтерфейсі Вікіпедії. Для уникнення великомасштабних збоїв та непотрібного навантаження на сервер, будь-які зміни спочатку потрібно перевірити на підсторінках /пісочниці та /тестів цього модуля, або у вашій пісочниці модуля. Потім перевірені зміни можуть бути впроваджені на цій сторінці єдиним редагуванням. Будь ласка, обговорюйте будь-які зміни на сторінці обговорення перед їхнім впровадженням. |
Цей модуль залежить від наступних модулів: |
{{Модуль:Delink}} (обг. · викор. · ред.)
Модуль реалізує {{Delink}}.
Документація вище включена з Модуль:Delink/документація. (ред. | історія) Дописувачі можуть експериментувати на підсторінках пісочниці (ред. | різн.) та тести (створити) цього модуля. Будь ласка, додавайте категорії до підсторінки /документація. Підсторінки цієї сторінки. |
-- Вилучає з вікітексту внутрішні і зовнішні посилання.
require('strict')
local yesno = require('Модуль:Yesno')
local p = {}
local getArgs
local function delinkReversePipeTrick(s)
if s:match("^%[%[|.*[|\n]") then -- Перевірити наявність нових рядків або багаторазових пайпів.
return s
else
return s:match("%[%[|(.*)%]%]")
end
end
local function delinkPipeTrick(s)
local linkarea, display = "", ""
-- Необхідно опрацювати двокрапки, дужки і коми.
-- Спочатку видаляємо текст перед першою двокрапкою, якщо вона є.
if s:match(":") then
s = s:match("%[%[.-:(.*)|%]%]")
-- Якщо двокрапок немає, залишити весь текст, крім квадратних дужок і пайпа.
else
s = s:match("%[%[(.*)|%]%]")
end
-- Наступна стадія — дужки і коми.
if s:match("%(.-%)$") then -- У дужок пріоритет над комами.
s = s:match("(.-) ?%(.-%)$")
elseif s:match(",") then -- Якщо дужок немає, вивести тільки текст перед першою комою.
s = s:match("(.-),.*$")
end
return s
end
local function delinkWikilink(s)
local result = s
-- Опрацювати трюк зі зворотним пайпом.
if result:match("%[%[|") then
return delinkReversePipeTrick(result)
end
result = mw.uri.decode(result, "PATH") -- Декодувати сутності, кодовані знаком відсотку. Залишити підкреслювання і плюси.
result = mw.text.decode(result, true) -- Декодувати сутності HTML.
-- Перевірити некоректні заголовки. Для цього потрібно визначити
-- область посилання, тобто частину перед пайпом.
local titlearea
if result:match("|") then -- Перевірити, чи маємо справу з пайп-посиланням.
titlearea = result:match("^%[%[(.-)|.*%]%]")
else
titlearea = result:match("^%[%[(.-)%]%]")
end
-- Перевірити наявність некоректних символів.
if mw.ustring.match(titlearea, "[%[%]<>{}%%%c\n]") then
return s
end
-- Перевірити наявність категорій, інтервікі і файлів.
local colonprefix = result:match("%[%[(.-):.*%]%]") or "" -- Отримати текст перед першою двокрапкою.
local ns = mw.site.namespaces[colonprefix] -- Пересвідчитися, що зазначено відомий простір імен.
if mw.language.isKnownLanguageTag(colonprefix)
or ( ns and ( ns.canonicalName == "Файл" or ns.canonicalName == "Категорія" ) ) then
return ""
end
-- Видалити двокрапку, якщо посилання містить трюк з двокрапкою.
if result:match("%[%[:") then
result = "[[" .. result:match("%[%[:(.*%]%])")
end
-- Опрацювати посилання, які містять трюк з пайпом.
if mw.ustring.match(result, "^%[%[[^|]*|%]%]") then
return delinkPipeTrick(result)
end
-- Знайти область відображення вікі-посилання
if result:match("|") then -- Визначити, чи посилання містить пайп.
result = result:match("^%[%[.-|(.+)%]%]")
-- Не відображати нові рядки багаторядкових пайп-посилань,
-- де яких пайп стоїть перед першим новим рядком.
result = result:gsub("\n", "")
else
result = result:match("^%[%[(.-)%]%]")
end
return result
end
local function delinkURL(s)
-- Припустимо, що внутрішні посилання вже прибрані,
-- після чого залишився текст між двома квдратними дужками [foo].
-- Якщо текст містить розрив рядка, він не відформатований як веб-адреса, незалежно від іншого вмісту.
if s:match("\n") then
return s
end
-- Перевірити наявність валідного URL-префіксу і принаймні одного валідного URL-символу.
local valid_url_prefixes = {"//", "http://", "https://", "ftp://", "gopher://", "mailto:", "news:", "irc://"}
local url_prefix
for i,v in ipairs(valid_url_prefixes) do
if mw.ustring.match(s, '^%[' .. v ..'[^"%s].*%]' ) then
url_prefix = v
break
end
end
-- Отримати текст для виводу
if not url_prefix then
return s
end
s = s:match("^%[" .. url_prefix .. "(.*)%]") -- Забрати весь текст після префіксу в веб-адресі і перед останньою квадратною дужкою.
s = s:match('^.-(["<> ].*)') or "" -- Забрати весь текст після першого символу-роздільника в веб-адресі ("<> ).
s = mw.ustring.match(s, "^%s*(%S.*)$") or "" -- Якщо символ-роздільник — пробіл, прибрати його.
local s_decoded = mw.text.decode(s, true)
if mw.ustring.match(s_decoded, "%c") then
return s
else
return s_decoded
end
end
local function delinkLinkClass(s, pattern, delinkFunction)
if not type(s) == "string" then
error("Спроба прибрати посилання з нерядкового вводу.", 2)
end
if not ( type(pattern) == "string" and mw.ustring.sub(pattern, 1, 1) == "^" ) then
error('Виявлено некоректний патерн. Патерни повинні починатися з "^".', 2)
end
-- Повторити для текстового рядка з заміною необхідного тексту, застосовуючи
-- функцію видалення посилань. Необхідно опрацьовувати текст символ за символом, а не
-- через gsub, інакше вкладені посилання не виявляються належним чином.
local result = ""
while s ~= '' do
-- Замінити текст, використовуючи одну ітерацію gsub.
s = mw.ustring.gsub(s, pattern, delinkFunction, 1)
-- Приєднати крайній символ зліва до похідного рядка.
result = result .. mw.ustring.sub(s, 1, 1)
s = mw.ustring.sub(s, 2, -1)
end
return result
end
function p._delink(args)
local text = args[1] or ""
if args.refs == "так" then
-- Прибрати усі стріп-маркери, що репрезентують теги ref. Може привести до
-- небажаних результатів — використовуйте тільки тоді, коли точно знаєте, що робите!
text = mw.ustring.gsub(text, "UNIQ%w*%-ref%-%d*%-QINU", "")
end
if not (yesno(args.wikilinks) == false) then
text = delinkLinkClass(text, "^%[%[.-%]%]", delinkWikilink) -- Прибрати внутрішні посилання.
end
if not (yesno(args.urls) == false) then
text = delinkLinkClass(text, "^%[.-%]", delinkURL) -- Прибрати зовнішні посилання.
end
if not (yesno(args.comments) == false) then
text = text:gsub("<!%-%-.-%-%->", "") -- Прибрати коментарі html.
end
if not (yesno(args.whitespace) == false) then
-- Замінити одиночні нові рядки одним пробілом, але залишити подвійні нові рядки
-- і нові рядки, які містять тільки пробіли або символи табуляції перед другим новим рядком.
text = mw.ustring.gsub(text, "([^\n \t][ \t]*)\n([ \t]*[^\n \t])", "%1 %2")
text = text:gsub("[ \t]+", " ") -- Прибрати додаткові символи табуляції і пробіли.
end
return text
end
function p.delink(frame)
if not getArgs then
getArgs = require('Модуль:Arguments').getArgs
end
return p._delink(getArgs(frame, {wrappers = 'Шаблон:Delink'}))
end
return p