Vai al contenuto

Wikinotizie:Bar/Cancellazione cronologia pagine generate in automatico

Da Wikinotizie, le notizie a contenuto aperto


Cancellazione cronologia pagine generate in automatico


Lista

[modifica]

gruppo
pagina
edit
dim (MB)
note
1 Template:Index 217245 970,9
  • linkato da :
  • nessuna inclusione
  • può essere ricreato con la sola ultima revisione e annotato come storico
2 Template:Currency 123317 310,3
4 Template:Dati petrolio/Auto 70902 8,4
4 Wikinotizie:Cestino/Template:Dati petrolio/Auto/01 39572 4,7
2 Wikinotizie:Cestino/Template:Currency/01 29687 65,2
1 Wikinotizie:Cestino/Template:Index/02 25797 116,1
  • linkato solo da discussioni
  • può essere totalmente cancellato
1 Wikinotizie:Cestino/Template:Index/01 25687 113,8
  • linkato solo da discussioni
  • può essere totalmente cancellato
2 Template:Currency/EUR 22728 285
2 Template:Currency/CAD 22728 284,9
2 Template:Currency/JPY 22725 285,2
2 Template:Currency/USD 22716 281,1
2 Template:Currency/GBP 22711 284,3
2 Template:Currency/AUD 22677 283,9
2 Template:Currency/CHF 22651 283,8
3 Template:Weather World F/Auto 14513 67,9
3 Template:Weather World C/Auto 13726 63,9
1 Template:Borse orfano, linka Template:Index

(dati estratti da stats.wikimedia.org/wikinews/...#mostedited, ‎domenica ‎10 ‎aprile ‎2011)

Discussione

[modifica]

Due anni fa era stata sollevata la questione della dimensione spropositata del Template:Index, che offre le ultime quotazioni di borsa. Questo template da solo occupa 970MB, ma l'insieme dei template generati automaticamente sfiora i 4GB sul database (3725MB) e quindi ancora di più su disco e sui backup. Gli altri sono Template:Currency (e sotto-template), Template:Dati petrolio/Auto, Template:Weather World C/Auto e Template:Weather World F/Auto, senza dimenticare i vari Wikinotizie:Cestino/Template:Index/01, etc: praticamente i primi 16 di questa tabella e qualcun altro. Si tratta di una cronologia di 724759 modifiche, l'82% di tutte quelle effettuate sul sito (884213).

Wikinotizie è un sito di articoli contenenti notizie, quindi avvenimenti. La cronologia serve per individuare gli autori degli articoli, per la licenza e a fini legali. Quei template invece sono forniti a scopo informativo all'interno della pagina principale, sono generati automaticamente da dei bot ed i loro dati non sono di alcuna utilità se non aggiornati. Le modifiche presenti nella cronologia vanno quindi svuotate periodicamente, sarebbe meglio se direttamente dal gestore del bot, inserendo la pagina nelle cancellazioni veloci.

Ci sono state alcune discussioni qui e qui, ma il punto non è se cancellare una pagina o meno. La cronologia di questi template non è necessaria ai fini del progetto e quindi va cancellata, anche nel caso non occupasse più di tre volte il resto del sito messo assieme (1052MB). Non metto le pagine in cancellazione veloce, ma lo scrivo qui per chiarire una volta per tutte la questione discutendone assieme. Ciao :) --Trek00 (talk) 22:07, 5 apr 2011 (CEST)[rispondi]

Personalmente sono favorevole alla cancellazione; se scaricassi un dump di 4GB per scoprire che i 3/4 sono sostanzialmente inutili, non ne sarei troppo felice :)  Non procedo immediatamente perché mi piacerebbe sentire altri pareri e, magari (ma non pregiudizialmente), anche avere risposta alla domanda che ho posto nelle discussioni sopra linkate (Discussioni template:Index e Discussioni template:Currency).
Diciamo che in assenza di ulteriori pareri sono orientato a procedere alle cancellazioni entro qualche settimana (salvo nuove ed eventuali e ripensamenti :-) -- Codicorumus  « msg 11:04, 8 apr 2011 (CEST)[rispondi]
Anch'io d'accordo con l'eliminazione di questi template oltreché pesanti, palesemente obsoleti. (sulle domande poste da Codicorumus, a dirla tutta non saprei) --Osк 23:49, 8 apr 2011 (CEST)[rispondi]
D'accordo anche io con la cancellazione della cronologia. La frequenza così elevata di modifiche da parte del bot di Fale non mi ha mai fatto impazzire di gioia, tanto più in un sito poco visitato come il nostro. Visto che ormai questi template non sono più aggiornati da oltre un anno non ha proprio senso mantenere queste pagine.
@Codicorumus: non mi risulta che la cronologia delle pagine rimosse venga mai cancellata, vedi per esempio Speciale:Ripristina/Wikinotizie:2005/Aprile/1: è la pagina cancellata più vecchia che sono riuscito a trovare su it.wikinews e la cronologia è perfettamente visibile agli amministratori.
Potrebbe essere difficile riuscire a cancellare una pagina con la cronologia così pesante. Proprio per evitare ciò avevo iniziato a decronizzare quei template, in realtà l'ho fatto solo due volte per Index, una per Currency e Dati petrolio/Auto. --Darth Kule - Comlink 15:42, 9 apr 2011 (CEST)[rispondi]
Direi che si può procedere, quindi.
Ho dato un'occhiata alla struttura del database: con la cancellazione, le revisioni delle pagine cancellate vengono spostate in un'altra tabella, questo più il fatto che scompaiono dai dump dovrebbe creare un sufficiente vantaggio; dovrebbero invece restare nella stessa tabella le revisioni nascoste di pagine non cancellate o recuperate parzialmente.
Mettiamo giù un elenco e poi procediamo ?
-- Codicorumus  « msg 20:02, 9 apr 2011 (CEST)[rispondi]
Per rispondere alla domanda di Codicorumus bisogna prendere in considerazione almeno due punti di vista. Dal punto di vista teorico, e quindi di significato, cancellare una pagina significa cancellarla [1]. Importante è ricordare che Wikipedia non è gratis, ha un costo ed è finanziato dalle donazioni volontarie. Quindi dobbiamo fare di tutto perché questi soldi vengano spesi bene [2].
Dal punto di vista tecnico ci sono moltissimi aspetti da prendere in considerazione. Il software MediaWiki ha un'apposita tabella nella quale si spostano tutte le revisioni cancellate (sia la revisione singola che l'intera cronologia di una pagina cancellata). Il contenuto della pagina invece rimane in una tabella globale, ma non è detto che questa non venga svuotata di tanto in tanto [3]. Infine i dump, i backup e i mirror diventano più snelli e semplici da gestire. Per avere un'idea dell'infrastruttura di wikipedia vi consiglio di guardare qui. Spero di aver soddisfatto i vostri dubbi. Ciao --Trek00 (talk) 10:46, 10 apr 2011 (CEST)[rispondi]

Ho inserito in cima la lista delle prime 16 pagine per numero di edit; così si può tener conto di quanto mano a mano fatto.
C'è da tener presente che alcune pagine possono appartenere ad un cluster più ampio ed è senz'altro meglio non cancellare prima di aver individuato tutte le pagine connesse. Per quanto ho visto finora, i cluster di Template:Index e Template:Currency mi sembra che siano già interamente compresi nella lista.
-- Codicorumus  « msg 20:18, 11 apr 2011 (CEST)[rispondi]

Ho provato a cancellare Wikinotizie:Cestino/Template:Index/01, ma ottengo questo messaggio:
« La cronologia di questa pagina è molto lunga (oltre 5.000 revisioni). La sua cancellazione è stata limitata per evitare di creare accidentalmente dei problemi di funzionamento al database di Wikinotizie. »
Evidentemente, su Wikinotizie i sysop non hanno permessi necessari ('bigdelete' o 'noratelimit', credo); magari ci può provare un burocrate, oppure passare la palla ai dev.
-- Codicorumus  « msg 09:10, 15 apr 2011 (CEST)[rispondi]
[aggiornamento] Il permesso dovrebbe essere 'bigdelete' e sembrerebbe non appartenere a nessun gruppo ordinario. Probabilmente queste cancellazioni non sono accessibili ai normali utenti e vengono eseguite direttamente sul database. 'noratelimit' invece non c'entra: ha a che fare con la frequenza degli edit.
-- Codicorumus  « msg 10:39, 15 apr 2011 (CEST)[rispondi]

Mi son perso l'intera discussione ma... tenerli e cancellare la cronologia ogni mese (o qualcosa di simile)? Se aggiornati sempre possono essere molto utili... --→ Airon Ĉ 14:31, 24 lug 2011 (CEST)[rispondi]

Cancellarli proprio non possiamo. Sull'utilità ho qualche dubbio, bisognerebbe comprendere se venivano effettivamente consultati e/o portavano traffico. -- Codicorumus  « msg 20:10, 25 lug 2011 (CEST)[rispondi]
In realtà la cancellazione di questi template è un'operazione altamente problematica: comporta lo spostamento di tabella di un numero spropositato di revisioni, la cancellazione comunque *non* libera spazio, al più i dump scaricati comunemente saranno più leggeri perché non contengono le revisioni cancellate, ma in ogni caso le revisioni ci sono "da qualche altra parte". Da un punto di vista tecnico il costo non è assolutamente dato dallo storage, lo storage è una frazione dei costi dell'hardware che costituiscono a loro volta una frazione del costo complessivo (il personale, l'energia e soprattutto la connettività costano di più). Il problema principale è che ora si è innescata una "bomba" logica, una pagina con una crono abbastanza grossa da causare problemi ogni volta che venga manipolata, la soluzione meno costosa sarebbe quella di proteggerla e lasciarla lì. --Vito (talk) 14:05, 28 lug 2011 (CEST)[rispondi]
Favorevole alla protezione. -- Codicorumus  « msg 23:10, 29 lug 2011 (CEST)[rispondi]