Шаблон беседа:Твърде дълга

Съдържанието на страницата не се поддържа на други езици.
от Уикипедия, свободната енциклопедия

Копирано от Разговори|oldid=12030365

Искам да поставя на обсъждане проблема с прекалено дългите страници. Към момента броят на статиите в бгУ с дължина над 120К е над 350. Преди доста време преведох Уикипедия:Дължина именно за да имам основание да посочвам кога дължината пречи на четимостта, но засега не срещам разбиране по въпроса. Копирам тук една таблица от английската У с препоръчителната дължина на статия (ако не е ясно, мога да преведа текста от английски, но не смятам, че някой ще се затрудни):

Readable prose sizea What to do
> 15,000 words > 100 kB Almost certainly should be divided
> 9,000 words > 60 kB Probably should be divided, although the scope of a topic can sometimes justify the added reading material.
> 8,000 words > 50 kB May need to be divided; likelihood goes up with size.
< 6,000 words < 40 kB Length alone does not justify division.
< 150 words < 1 kB If an article or list has remained this size for over a couple of months, consider combining it with a related page. Alternatively, the article could be expanded; see Wikipedia:Stub.
a Each kB can be equated to 1,000 characters

Какво мислите? Трябва ли да се предприеме съкращаване на такива неудобочетими статии? Ket (беседа) 16:19, 28 октомври 2023 (UTC)[отговор]

Къде мога да видя кои са дългите статии (над 100 kB)? Принципно ми звучи разумна идея да ги разделим и/или съкратим. Elizaiv22 (беседа) 20:30, 28 октомври 2023 (UTC)[отговор]
Специални:Дълги страници Ket (беседа) 06:15, 29 октомври 2023 (UTC)[отговор]
Номер 1 в списъка е безумна статия. Списък на герои от „Игра на тронове“ като за всеки има текст като за цяла статия при това неформатиран. Объркващо е че седи в този вид от години а някои доста опитни редактори са минавали през нея.
Има и други бисери вкл. едно село което наблюдавам от доста години и се чудя защо никой не му обръща внимание. Сале (беседа) 07:11, 29 октомври 2023 (UTC)[отговор]
Ket, малко ме учудва това че си превела въпросната таблица на Уикипедия:Дължина#Общи_препоръки но тук не си я копирала оттам а от английската. Сале (беседа) 07:40, 29 октомври 2023 (UTC)[отговор]
Имам два коментара от опита ми с няколко избрани статии, които са в списъка - Атом, Бразилия, Втора световна война.
  • При някои обекти (от рода на големи страни или мащабни исторически събития) в един момент статиите се превръщат в портал по темата, който трябва да съдържа - включени в текст - определена маса ключови препратки. Когато това се направи, става доста трудно да се постигне съществено съкращение без голяма загуба на изчерпателност. Специално с Втора световна война съм правил опити да я съкратя и сигурно още може да се махне по някое изречение тук и там, но разделите са нужни, за да се даде обща представа за процеса.
  • В добре направени статии голяма част - 40-50% - от размера са източници, които не влияят особено на четимостта.
В същото време много статии в списъка вероятно може да се разделят. --Спас Колев (беседа) 07:44, 29 октомври 2023 (UTC)[отговор]
Бих добавил също, че трябва да се вземе впредвид също и спецификата на българския език, когато се гледа тази таблица. Случайно хванах статията Френска революция, която е малко над 100Кb, но в същото време има не повече от 6500 думи в нея, ако не се броят бележки и източници. Според таблицата това е съвсем четлива статия. --ikonact (беседа) 07:54, 29 октомври 2023 (UTC)[отговор]
А, да - в тези метрики кирилските букви вероятно се броят по два байта на символ, както се записват в Уникод. --Спас Колев (беседа) 08:06, 29 октомври 2023 (UTC)[отговор]
По този повод няма проблем просто да намалим критериите на около 2/3 защото далеч не всичко е на кирилица. Сале (беседа) 08:45, 29 октомври 2023 (UTC)[отговор]
@Nk, би ли споделил опита си от проекта Уикипедия:1000 статии за изчисляването на обема? Бихме могли да го приложим и тук Ket (беседа) 14:38, 30 октомври 2023 (UTC)[отговор]
Имам едно скриптче, което изключва коментарите (и едновремешните мепове) и брои символите в остатъка (т.е. резултатът изключва двойните байтове на кирилицата, но запазва ref-елементите).
Тук има някакъв интерфейс към скрипта: http://az-pitam.org/wiki_tools/1000/. Мога да дам и кода, но същественото се свежда до $wiki = preg_replace('/<!--(.|\s)*?-->/', '', $wiki); return mb_strlen($wiki, 'utf-8');. --Спас Колев (беседа) 15:09, 30 октомври 2023 (UTC)[отговор]
 В същото време много статии в списъка вероятно може да се разделят. 
Имаме чудесен пример в статията за Бургас. Разделът История е с близо два пъти по-голям обем от основната статия. Около 4700 думи в раздела срещу 2900 в „основната“. Сале (беседа) 16:49, 3 ноември 2023 (UTC)[отговор]

Споделям напълно мнението, че огромният обем пречи на четимостта – всъщност прави статиите направо невъзможни за четене според мен – и че трябва да бъдат разделяни, като в главната статия се дават съществените неща, а при необходимост подробностите се обособяват в отделни статии, за хората с по-специални интереси. Разбира се, има и статии като Втората световна война, които обхващат толкова важен и наситен период, че се налага обемът им да бъде голям, но те са изключения.

Използвам случая да споделя неприятното си впечатление и от обратно явление – за някои певци, групи и други статиите са доста кратки, но пък се правят отделни за някоя песен/албум, които биха могли да бъдат просто раздел от статията. --Randona.bg (беседа) 08:03, 29 октомври 2023 (UTC)[отговор]

В количествен смисъл: Критериите по-горе за kB наистина трябва да се увеличат за нас (не удвоят, тъй като само при кирилицата имаме удвояване). По отношение не думите не съм сигурен, понеже не разполагам с изследване за многословността на българския език спрямо английския. По отношение на броя знаци, при нас са около 10% повече. Взех за пример статията, която е около 150 kB (50% над лимита от горната таблица): Списък с епизоди на Keeping Up With The Kardashians, като се оказа, че има грубо 14000 думи (в границата) и 78000 знака. По отношение на самия проблем има различни типове статии, с които може да се постъпва по различен начин. Има статии, чието съдържание частично може да се пренесе в подстатия, има статии, чието съдържание просто трябва да се съкрати, например при Лесковдол раздел Диалект направо може да се премахне – Лесковдолски диалект няма, а други раздели значително да се намалят. За статиите които не са свързани с България и имат статии на английската Уикипедия може да се прегледа там как са ги представили. Списъчни статии могат да се разделят на множество такива, А-Я, по години, десетилетия, векове или по раздели (напр. за Списък с филмите на „Юнайтед Артистс“ в английската Уикипедия е препоръчано да се разделят по десетилетия). Големите статии за населени места винаги могат да се съкратят, като информацията се прехвърли в подстатии. Някои статии обаче, може да имат съществена информация и не е добре да се намаляват просто за да влязат в някакви количествени граници. Като цяло подходът трябва да е индивидуален, а количествените характеристики само препоръки, създадени за да ориентират редакторите. --Стан (беседа) 16:08, 30 октомври 2023 (UTC)[отговор]
Относно Лесковдол не бих се определил като привърженик на идеята да се премахне целият раздел. Има източници и е описано как се е променил местният говор. Информацията е била добавена от D2xv, вероятно той може да направи коментар. Carbonaro. (беседа) 16:27, 30 октомври 2023 (UTC)[отговор]
Според тази сметка знаците в българския идват 10% по-малко отколкото в английския: [1]. --Спас Колев (беседа) 13:20, 31 октомври 2023 (UTC)[отговор]
Идеята ми е да сложим някакъв разумен горен таван на полезния текст (изключвам инфокарета, картинки,таблици, и разбира се източници/бележки), който ако е повече от ХХХХХ байта да му слагаме шаблон Дълга страница. Този шаблон може да е като в enWiki en:Template:Very long, може и да е просто уведомление, че за прочитането на статията изцяло са необходими еди колко си минути (забелязах това на статиите например тук - "четиво за 8 минути"), а може и да е комбинация от двете. Ket (беседа) 14:25, 31 октомври 2023 (UTC)[отговор]
Благодаря на @Nk за подсказката. Всъщност започнах да превеждам английския шаблон тук, но не ми достигат технически познания: например имаме ли еквивалентна функция на {{{rps}}} kilobytes. Моля за помощ някой от програмистите! Ket (беседа) 09:34, 3 ноември 2023 (UTC)[отговор]
В самия шаблон rps не е функция, а параметър, който трябва да се попълва при използването на шаблона. Изглежда идеята е да се попълва ръчно със стойност, получена с тази джаджа en:Wikipedia:Prosesize, която трябва да се пробва как би работила при нас. --Спас Колев (беседа) 14:21, 3 ноември 2023 (UTC)[отговор]
Вижте тази вълшебна думичка: {{PAGESIZE:Уикипедия}}. Можем да направим шаблона така, че според големината на страницата динамично да генерира някакво съобщение. Например при над 100000 B – Страницата е твърде дълга, моля, помислете..., при над 60000 – Четимостта на страницата може да е проблем... и така. Carbonaro. (беседа) 17:41, 3 ноември 2023 (UTC)[отговор]
Чудесно звучи, можеш ли да го реализираш? Ket (беседа) 19:17, 5 ноември 2023 (UTC)[отговор]
Ще пробваме, няма причина да не стане. Идеята ми беше да не се въвежда ръчно това {{{rps}}}. Carbonaro. (беседа) 20:03, 6 ноември 2023 (UTC)[отговор]


────────────────────────────────────────────────────────────────────────────────────────────────────Само начален проект на шаблона, моля който иска да коригира и подобрява!--Ket (беседа) 08:59, 9 ноември 2023 (UTC)[отговор]

Ket, текстът излиза като „Тази article е твърде дълга за удобно четене и навигация.“
Ще опитам да го поправя. Сале (беседа) 12:43, 9 ноември 2023 (UTC)[отговор]
Странно. Тук излиза едно а като го сложа в статия друго. Проблемът е в {{{1|{{#if:{{NAMESPACE}}|статия|article}}}}} Сале (беседа) 12:45, 9 ноември 2023 (UTC)[отговор]
Ама съм завеян. Естествено, че тук именното пространство е шаблон, не статия. Сале (беседа) 12:48, 9 ноември 2023 (UTC)[отговор]
@Ket, мисля че се ориентирах и смених този #if със #switch където могат да се изброят отделни именни пространства. Не мисля че има смисъл за всичките. Прекалено дълъг за четене шаблон например е безсмислица.
Остава въпроса къде точно да го слагаме. В началото на статията или някъде другаде? Виж например как седи в Бургас Сале (беседа) 13:14, 9 ноември 2023 (UTC)[отговор]
Благодаря ти, изглежда много добре. Началото на статията е най-подходящото място според мен. Разбира се очаквам при поставянето редакторите да преценяват дали е възможно съкращение - аз например не бих го сложила на Атом или Втора световна война, както бе отбелязано по-горе. Ket (беседа) 17:20, 9 ноември 2023 (UTC)[отговор]
Засега се отказвам. Тези модули прецакват всичко. Със сигурност нещо пропускам, но нямам повече нерви да се занимавам. Carbonaro. (беседа) 21:18, 9 ноември 2023 (UTC)[отговор]
Ама разбира се! Как може да съм толкова... Carbonaro. (беседа) 21:40, 9 ноември 2023 (UTC)[отговор]
Сале, Carbonaro.Искам да попитам дали изразът PAGESIZE:{{FULLPAGENAME}}|R}}/2/2000 включва източниците: 1) в текста; 2) както са изброени отдолу на статията? Защото в момента съкращавам Джефри Епстийн и виждам голям зор да стигна поне до 150К.--Ket (беседа) 12:08, 14 ноември 2023 (UTC)[отговор]
Ket, бързият тест в пясъчника ми показва че PAGESIZE включва всички байтове т.е и източниците. Между другото не съм особено съгласен с Carbonaro. за конверсията от брой байтове към време за четене. Дори и да има някакви установени правила те по-скоро ще са свързани с броя думи а не броя байтове, които пък както сме коментирали зависят и от езика, то скоростта на четене се различава драстично при различните хора. Това което един ще прочете внимателно за 5 минути на друг може да отнеме 30 за повърхностен преглед. Сале (беседа) 13:55, 14 ноември 2023 (UTC)[отговор]
Благодаря ти, Сале. Значи в конкретния случай на Джефри Епстийн, който съдържа 240 източника (в случая те са баласт), повечето старателно архивирани (което още повече увеличава баласта), аз смятам да приема, че полезният текст може би вече клони към 150К, което е и целта. Имаш право за различните скорости за четене, може би трябва да има интервал min/max т.е. "от X минути до Y минути". Ket (беседа) 14:52, 14 ноември 2023 (UTC)[отговор]

────────────────────────────────────────────────────────────────────────────────────────────────────Някой има ли нещо против да добавя към шаблона препратка към външна статистика? Мисля че ще е полезно нещо от рода на:  За повече информация виж тази [https://xtools.wmcloud.org/articleinfo/{{SERVERNAME}}/{{FULLPAGENAME}} статистика] 

Там освен байтове броят символи, думи и секции. Между другото таблиците също могат значително да увеличат броя на байтовете.-- Сале (беседа) 14:59, 14 ноември 2023 (UTC)[отговор]

Мисля че дава много по-добра идея за дължината. За Джефри Епстийн в момента казва:
  • Bytes 73,912
  • Characters 41,327
  • Words 6,545
  • Sections 36
  • References 327
  • Unique references 240
Сале (беседа) 15:07, 14 ноември 2023 (UTC)[отговор]
Добри забележки и от двамата. Точно така, изразът включва всички знаци. Идеята беше първо да накарам шаблона да работи, после вече да уточняваме детайлите. Тъй като не можем да определим броя на думите с някаква вградена функция, от различни източници установих, че човек без проблем може да прочете около 1500 знака за минута. {{PAGESIZE}} показва броя на байтовете, а както знаем, кирилските букви се кодират с по два байта, някои знаци – с три и така нататък. Затова получения резултат разделям на две. Всичко това разделям на 2000 – малко повече от 1500, с идеята да се прескочат атрибутите, които не се четат (таблици, уикикод, източници). Както установявате, това е изключително примитивен подход, то и затова пише: „Прочитането на целия текст може да отнеме...“ (да се оправдая). ухилване Все пак исках да е нещо по-разбираемо за хората, защото „Текущата дължина на текста е 83 299 байта“ нищо не им говори. Carbonaro. (беседа) 15:55, 14 ноември 2023 (UTC)[отговор]
Създадох Модул:Word count и ще го разширя така, че да показва броя на думите, без да включва източниците, категориите и някои шаблони. Carbonaro. (беседа) 20:58, 14 ноември 2023 (UTC)[отговор]
Чудесна идея, благодаря ти! Може би не е лошо броят думи да фигурира изрично изписан. Сега остава само да решим коя дължина/време са прекалени, т.е. кога да слагаме шаблона. Имаме Бургас 333 К - 54 мин и Джефри Епстийн 189 К - 18 мин. Предлагам една горна граница от 150 К (или колко думи), както спомена по-горе @StanProg. Това е важно за документацията на шаблона. Между другото,никога не съм писала документация на шаблон досега, но се надявам с общи усилия да се справим. Ket (беседа) 10:00, 15 ноември 2023 (UTC)[отговор]
Ще се справим, разбира се. Тя дори не е нужно да е дълга. Просто може да се обясни кога се използва, и да се обобщи това, което сме обсъждали – че не на всички статии трябва се слага и че е добре абзаците, които не са от първостепенно значение за основната статия, да бъдат отделени в нова. Чудя се дали изобщо ще се използва за беседи, по-скоро не. Да махнем ли онази проверка и да караме само с думата „статия“? Прави ми впечатление и че има доста параметри на английски (name, subst, small, fix, date, nosplit). Хубаво е да са на български, за да са по-разбираеми, и може би да обсъдим няма ли излишни. Carbonaro. (беседа) 18:38, 15 ноември 2023 (UTC)[отговор]
Carbonaro.,  Чудя се дали изобщо ще се използва за беседи, по-скоро не. Да махнем ли онази проверка и да караме само с думата „статия“? 
и аз това се чудех когато смених #if: със #switch: По-скоро беше упражнение. Нито в беседи нито в шаблони има смисъл да се използва. Сале (беседа) 20:10, 16 ноември 2023 (UTC)[отговор]
+1. Ket (беседа) 02:07, 17 ноември 2023 (UTC)[отговор]

Съобщение на Advisor.js[редактиране на кода]

Копирано от Потребител беседа:Ted Masters: Ket (беседа) 14:52, 30 ноември 2023 (UTC)[отговор]


Здравей, можеш ли да видиш при каква дължина на статията излиза съобщението "Тази страница е прекалено дълга. Oбработката на текста е спряна — Advisor.js ще изисква много RAM и процесорни ресурси, докато се опитва да анализира текста, което може да доведе до спиране на страницата, браузъра или дори процесора."? Питам, защото се чудя кога да определим една страница за дълга - създадохме с общи усилия един Шаблон:Твърде дълга, но сега трябва да му напиша документация и още се колебая каква граница да сложа. Ket (беседа) 09:57, 29 ноември 2023 (UTC)[отговор]

Здравей, Ket! Това съобщение излиза, когато страницата надхвърля 204 800 байта. В интервала 204 800 – 102 400 байта излиза друго подобно съобщение: Тази страница е сравнително дълга. Advisor.js може да консумира много RAM и процесорни ресурси, докато се опитва да анализира текста. Можеш да ограничиш редакцията на един раздел или да провериш текста. Предполагам, всичко над 100 000 байта може да бъде считано за дълго и в посочения от теб шаблон. --Ted Masters (беседа) 21:04, 29 ноември 2023 (UTC)[отговор]