Обговорення користувача:Oleksii0/Розмір статей на Мета (30.10.2008—31.10.2008)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Повний архів: Обговорення_користувача:Oleksii0/АвтоАрхів
Обговорення: Обговорення_користувача:Oleksii0

Розмір статей на Мета

[ред. код]

Ваші виправлення неправильні. Гляньте, будь-ласка, сюди. Це список статей, які нам варто доробити, щоб покращити наш рахунок. Порівняйте розмір, наведений там з реальним. Дядько Ігор 17:09, 30 жовтня 2008 (UTC)Відповісти

Я не розумію, що наведені цифри означають у вказаному розділі. Вони точно не збігаються з розміром українських статей, помноженим або поділеним на цей коефіціент. Тому не знаю, як зробити висновок на їх основі. Проте, якщо подивитесь у пояснення фактору weight в таблиці, то там вказано, що він розраховувався виходячи з того, що текст у 1162 символи англійською мав 969 символи українською, тобто український еквівалентний текст був коротшим, а значить і пороги для української мови менші. Сама формула, наведена в таблиці, weight=English/Local, тобто 1162/969~1,3 для української мови. Тобто слід самі ділити, а не помножати на коефіціент.--Oleksii0 18:25, 30 жовтня 2008 (UTC)Відповісти
Є два заперечення. Цифри не співпадають тому, що оцінюється тільки читабельний текст, тобто інтервікі й всякі службові слова викидаються. Другий аргумент те, що неймовірно, щоб український текст був коротший. В англійській мові половина слів односкладові, а в українській ні. Гляньте на статтю Касабланка (фільм), яка є майже точним перекладом. У нас вона 76 К, у англійців - 60. Можете провірити на будь-якому тексті. Того, що написане в пояненні я не розумію. Дядько Ігор 18:43, 30 жовтня 2008 (UTC)Відповісти
Я не заперечую, ці коефіціенти і мені здаються дивними. Я сам спробував підрахувати, на lib.ru є велика кількість російських перекладів та їх англійських оригіналів (вказана вами стаття не абсолютно точно співпадає з оригіналом), зазвичай виходить що російські варіанти мають довжину від 100 до 110% англійських (мене вже і це здувавало, я вважав різницю більшою) (українська не дуже відрізняється від російської структурою, і для російськьої коефіціент схожий - 1,4). Для української нажаль текст на meta не наведений, але він наведений для російської, і ви можете впевнитися, що підрахунок символів вірний (я перевіррив його в MS Word) - тобто російський варіант коротший за англійський. Таким чином, ймовірно вірно і для української, але навіть якщо ні, ми можемо лише вказати на це на меті, проте хтось підрахував саме так. До речі, я сам написав в обговоренні на меті про цю розбіжність в розмірі біблейського та сучасних текстів, але ніякої реакції...--Oleksii0 18:54, 30 жовтня 2008 (UTC) P.S.Відповісти
Ще раз глянув на наведене вами посилання сюди. Австрія (29334) якщо поділити 29334 на 1,3 отримаємо 22564, підрахунок символів в ворді 22224, Малярія (29703), 29703/1,3=22848, підрахунок по тексту 19251, Економіка (29706), 29706/1,3=22850, підрахунок по тексту 20889. Тобто наведені числа більші за реальні, відповідно розмір українського тексту домножається на коефіціент, а пороги, якщо порівнюються з реаньним текстом, відповідно нижчі.--Oleksii0 15:05, 31 жовтня 2008 (UTC)Відповісти
Ок, може виявитися, що ми обидва праві. Розмір статті Австрія у Вікіпедії - 40 023 байти, англійці дають 29334 байти, у ворді виходить 22224. В такому випадку границя в 30K лежить в українській Вікіпедії десь на позначці 42 K, що відповідає приблизно 22,5 К у ворді. Різиця, мабуть в тому, що Вікіпедія дає розмір у юнікоді, а ворд використовує cp1251. Дядько Ігор 15:14, 31 жовтня 2008 (UTC)Відповісти
Проте там є і службові символи, зокрема поля шаблонів. Дійсно, оцінювати слід число символів, а не розмір статті в байтах, тоді діє вказаний коефіціент 1,3--Oleksii0 15:18, 31 жовтня 2008 (UTC)Відповісти