Privacy Policy Cookie Policy Terms and Conditions Benutzer:ComillaBot/Diskussionsarchiv - Wikipedia

Benutzer:ComillaBot/Diskussionsarchiv

aus Wikipedia, der freien Enzyklopädie

Archiv Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Um ein vorheriges Thema wieder aufzugreifen, kann die aktuelle Diskussionsseite unter Verweis auf den entsprechenden Abschnitt dieser Archivseite benutzt werden.

Inhaltsverzeichnis

Name des Bots

Frage: wie soll der Bot heißen? Wenn das geklärt ist, könnten wir ihm schon mal einen Account sichern und dann auch dort weiterdiskutieren. Ideen? --Tobias K. 20:58, 18. Jul 2006 (CEST)

Ein paar Vorschläge/Inspirationen:

  • NBSP
  • Plenk
  • NBSPlenk
  • NBSBot (Non-Breaking Space Bot)
  • Spacer (soviel wie Abstandhalter)
  • SpaceInvader (Leerzeichen Angreifer)
  • doublequotemark
  • guillemet (fr. Anführungszeichen)
  • Comilla (sp. Anführungszeichen)

--Flea 16:26, 20. Jul 2006 (CEST)

„NBSBot“ klingt gut, „Comilla“ gefällt mir auch. Ein „Bot“ oder ein vergleichbarer Namenszusatz sollte auf jeden Fall in den Namen aufgenommen werden, damit dem Betrachter (z.B. in der Versionsgeschichte) klar ist, dass es sich um einen Bot handelt. --Tobias K. 10:00, 21. Jul 2006 (CEST)
ComillaBot find ich auch gut. Gegenvorschläge? --Flea 20:06, 25. Jul 2006 (CEST)


Aufgaben des Bots

Flea hat hier vorgeschlagen, damit anzufangen, eine Liste der möglichen Aufgaben des Bots zu erstellen. Also bitte eifrig Ideen sammeln! --Tobias K. 20:58, 18. Jul 2006 (CEST)


Ich benutz _ mal als Erzatz für das geschützte Leerzeichen. Bitte korrigiert mich, falls ich was falsch gemacht habe. --Flea 21:36, 18. Jul 2006 (CEST)

  • <Zahl>°C -> <Zahl>_°C
    • 5°C -> 5_°C
    • 5° C -> 5_°C

Pro – Christopher 01:08, 30. Jul 2006 (CEST)

  • <Zahl> - <Zahl> <Einheit> -> <Zahl> bis <Zahl>_Einheit
    • 5-7m -> 5 bis 7_m
    • 5 - 7m -> 5 bis 7_m
    • 5-7 m -> 5 bis 7_m
    • 5 - 7 m -> 5 bis 7_m

Meinst du das „bis“ als ausgeschriebenes Wort? Wenn ja: ist das in der Wikipedia so üblich?

Ich weiß nicht ob das "bis" wikiüblich ist, aber es ist Standard in wissenschaftlichen Texten. Das "-" könnte als minus interpretiert werden und ist deshalb zu vermeiden. Alternativ kann man auch "–" nehmen. Allerdings sollte man es in der Nähe von Formeln meiden. Leider hält sich keiner daran. Auch in einer Doktorarbeit in Physik hab ich das "-" gefunden. Ganz genau muss es sogar 5 m bis 7 m heißen. Ganz schlimm ist 5 - 70000 kg. Mit Monatsbezeichnung meinst Du den ausgeschriebenen Monatsnamen? --Flea 23:33, 18. Jul 2006 (CEST)
Dies sollte man mit Vorsicht genießen. In Tabellen ist „5–7_m“ sicher die bessere Lösung als „5 bis 7_m“. Können wir Tabellen ausschließen? Im Fließtext plädierte ich schließlich für „fünf bis sieben Meter“, nach der alten Regel, Zahlen bis einschließlich zwölf auszuschreiben. Christopher 01:08, 30. Jul 2006 (CEST)
Wie wäre es mit folgender Vorgehensweise: Alle 5-7m (oder vergleichbare Schreibweisen) werden zunächst einmal in 5–7_m umgewandelt, was schon einmal eine Verbesserung ist. Die Formulierung mit „bis“ bzw. auch die Ausschreibung von Zahlen werden dann nach Bedarf vom Bearbeiter vorgenommen. Es dürfte dem Bot nämlich schwer fallen, zu entscheiden, wie es am besten ist, bei Jahreszahlen etwa ist ja auch außerhalb von Tabellen eine Schreibung ohne „bis“ gängig (1923–2003). --Tobias K. 09:06, 30. Jul 2006 (CEST)
Ja, das erscheint mir keine schlechte Idee. Christopher 14:50, 30. Jul 2006 (CEST)

Weitere Ideen (<WS> sei Whitespace) --Tobias K. 22:17, 18. Jul 2006 (CEST)

  • <WS>[,.!?] -> [,.!?]
  • <Zahl>.<Monatsbezeichnung> -> <Zahl>. <Monatsbezeichnung>

Bis hierhin: Pro – Christopher 01:08, 30. Jul 2006 (CEST)

  • <Buchstabe> - <Buchstabe> -> <Buchstabe> – <Buchstabe>
Es gibt Schreibweisen wie „Pulitzer - Preis“, aus denen der Bot „Pulitzer – Preis“ machen würde. Kein echter Gewinn, oder? Christopher 01:08, 30. Jul 2006 (CEST)
Ist die Schreibweise „Pulitzer - Preis“ denn korrekt? Eigentlich ist das doch einfach ein Bindestrich, und um Bindestriche stehen normalerweise nie Leerzeichen. Der Artikelname heißt ja auch „Pulitzer-Preis“. Demnach würde im Grunde nur eine falsche Schreibung in eine andere umgewandelt. Ansonsten müsste der Bot-Operator eben auf so etwas achten. --Tobias K. 09:06, 30. Jul 2006 (CEST)
Nein, natürlich ist die Schreibweise nicht korrekt, aber sie existiert ab und an. Da ich inzwischen gesehen habe, dass es auf einen halbautomatischen Bot hinauslaufen wird, sind solche Zweifelsfälle manuell natürlich leicht zu korrigieren. Das Problem ist also keines. Christopher 14:50, 30. Jul 2006 (CEST)

S. a. Diskussionsseite --Simon Diskussion/Galerie 23:53, 18. Jul 2006 (CEST)

Ja, ich meine den ausgeschriebenen Monatsnamen, etwa 1.Januar nach 1. Januar. Könnte man das vielleicht sogar so erweitern? Bitte Einwände, wenn falsch! --Tobias K. 09:17, 19. Jul 2006 (CEST)

  • <Zahl>.<Buchstabe> -> <Zahl>. <Buchstabe>
  • <Zahl> <Einheit> -> <Zahl>_<Einheit>

Das wird knifflig, weil man alle verwendeten Einheiten wissen muss. --Flea 10:33, 19. Jul 2006 (CEST)

So schwierig ist das nicht: Wir geben einfach so viele Einheiten wie möglich vor. Standardeinheitentabelle (m, g, s, N, ...) eingeben, Liste der Präfixe eingeben, Kombinationen daraus sind Einheiten. --Tobias K. 19:27, 19. Jul 2006 (CEST)


Eine grundsätzliche Entscheidung: Soll der Bot in eindeutigen Fällen auch Rechtschreib- und Tippfehler korrigieren, in der Art von „Standart “->„Standard “?

Contra, denn das kann ein vollatuomatischer Bot machen. Oder? --Simon Diskussion/Galerie 13:46, 20. Jul 2006 (CEST)
Contra – ein gutes Argument, ich schließe mich dem an. Es gäbe auch wenig „Synergieefekte“, von daher kann das gut ein anderer Bot machen. Wir sollten uns auf syntaktisch-typographische Verbesserungen konzentrieren, die einen Menschen vor dem Bildschirm erfordern. (Wenn dahingehend Einigkeit bestehen sollte, wäre dies eine gute Richtlinie für das Projekt.) --Tobias K. 15:37, 20. Jul 2006 (CEST)
Contra, dafür gibt's andere spezialisierte Bots. Ich denke die bisher gesammelten Aufgaben sind schon Arbeit genug. --Flea 16:07, 20. Jul 2006 (CEST)

Gut, nachdem erst einmal kaum weitere Stimmen zu erwarten sind, ist das Ergebnis hinreichend eindeutig. Der Bot wird sich also auf Tätigkeiten im Umfeld der bereits gesammelten beschränken, mit halbautomatischer Arbeitsweise. --Tobias K. 11:28, 21. Jul 2006 (CEST)

Sollten wir entsprechend Wikipedia:Typografie#Auslassungspunkte eine Ersetzung von ... (3 Punkte) mit … (ein einzelnes, spezielles Zeichen für Auslassungspunkte, sieht aber meist gleich aus) durchführen? --Tobias K. 11:01, 23. Jul 2006 (CEST)

Pro – Christopher 01:08, 30. Jul 2006 (CEST)
Pro, und wahrscheinlich muss man auch gerade (manuell) schauen, ob ein Leerschlag davor gehört, siehe Artikel oben ... Ich muss mal schauen, wo ich die unter Linux finde, Windows hat sie bei Alt-0133 (glaub ich). – Simon Diskussion/Galerie 10:10, 30. Jul 2006 (CEST)

Regeln für den Bot

Wem noch ganz neue Aufgaben einfallen, der kann sie unter „Aufgaben“ vorstellen. Für die bereits gefundenen könnten wir – als Vorstufe für die tatsächliche Umsetzung – möglichst exakte Regeln definieren. Ich schlage folgende (naheliegende) Vorgehensweise vor: Wir gehen von einem Regelvorschlag aus und perfektionieren ihn durch Einarbeitung aller Einwände und Verbesserungen, die uns einfallen. --Tobias K. 11:28, 21. Jul 2006 (CEST)

Ich habe in einem Artikel „Ko-fermentierung von 5C- und 6C-Zuckern aus Biomasse“ gefunden. Sowas sollte den Bot nicht in die Irre führe. --Flea 09:51, 22. Jul 2006 (CEST)

Wie wäre eine Angabe der Regeln mit Regulären Ausdrücken? --– Simon Diskussion/Galerie 19:01, 29. Jul 2006 (CEST)

Ich hatte auch daran gedacht, sie in regulären Ausdrücken anzugeben, bin aber dann davor zurückgeschreckt, weil die ja nicht unbedingt jeder versteht. Letztlich bietet es sich aber ohnehin an, sie in reguläre Ausdrücke zu überführen, siehe unten. --Tobias K. 20:46, 29. Jul 2006 (CEST)

Anführungszeichen

  • <LZ oder Absatzanfang>"<beliebige Zeichen>" -> <LZ oder Absatzanfang>„<beliebige Zeichen>“
Erkennt dann natürlich nicht Zollzeichen in Zitaten ("Ich habe mir einen 19"-Monitor gekauft."), aber die kommen ja nicht so oft vor. --Tobias K. 16:36, 25. Jul 2006 (CEST)

Striche

Gedankenstrich:

  • <Buchstabe> - <beliebige Zeichen, aber kein Satzzeichen> - <Buchstabe> -> <Buchstabe> –_<beliebige Zeichen, aber kein Satzzeichen>_– <Buchstabe>
  • <Buchstabe> - <Buchstabe> -> <Buchstabe> – <Buchstabe>
Achtung: [[Bild:Heute - ein sonniger Tag.jpg]] – blöd, nicht?
Aber dafür ist er ja halbautomatisch ;) – Simon Diskussion/Galerie 17:10, 21. Jul 2006 (CEST)
Tja, ein berechtigter Einwand. Also: beim Bearbeiten später darauf achten, ob außen so kleine, unscheinbare eckige Klammern sind! Wenn es nicht zu aufwändig ist (abhängig von der verwendeten Technologie) wäre es natürlich auch gut, dem Bot beizubringen, dass er bestimmte Textteile gleich ignorieren soll. Mal sehen... --Tobias K. 20:25, 21. Jul 2006 (CEST)

Bis-Strich bei Jahreszahlen in Klammern

  • (<bis zu 4 Ziffern><[LZ,_,nichts][-,–][LZ,_,nichts]><bis zu 4 Ziffern>) -> (<bis zu 4 Ziffern><[LZ,_,nichts][-,–][LZ,_,nichts]><bis zu 4 Ziffern>)

Zahlen mit Einheiten

  • <Zahl><LZ, nichts><Einheit> -> <Zahl>_<Einheit>
  • <Zahl><LZ, nichts>°C -> <Zahl>_°C

Sonstiges

x-ter (etwa in Datumsangaben):

  • <Zahl>.<Buchstabe> -> <Zahl>._<Buchstabe>

überflüssige Leerzeichen entfernen:

  • <LZ><!?.,;> -> <!?.,;>
  • <beliebig viele LZ> -> <LZ>

Umsetzung

Nachdem jetzt ja schon einiges an Regeln vorhanden ist, sollten wir uns allmählich Gedanken über die Umsetzung des Projekts machen. Außer der noch nicht abschließend geklärten Namensfrage steht vor allem die Entscheidung für die technische Basis an: Pywikipediabot? Vorschläge bitte! --Tobias K. 16:37, 25. Jul 2006 (CEST)


Viele Vorschläge scheinen ja nicht gerade zu bekommen zu sein ... Von daher habe ich mal versucht, dem Pywikipediabot einige von den Regeln mit Hilfe regulärer Ausdrücke beizubringen. Das Ergebnis in Code seht ihr hier. Wenn ihr damit klarkommt, könnt ihr gerne daran weiterarbeiten (Änderungen in der Zusammenfassung oder auf der dortigen Diskussionsseite begründen), ansonsten bietet sich die dortige Diskussionsseite auch an, um Detailfragen zu der Umsetzung der Regeln zu klären.

Ich bin mit der Pywikip.-Lösung halbwegs zufrieden. Lasst doch auch mal einen Test laufen (z.B. an Benutzer:Tobias K./Bottest), um zu sehen, ob euch Pywikip. grundsätzlich zusagt. (Ich weiß nicht, ob ihr euch Pywikip. schon mal angeschaut habt, ansonsten werde ich versuchen, das Vorgehen zu erklären.)

Übrigens: wenn es gegen den Namen nicht doch noch Einwände gibt, werde ich morgen einen Account für „ComillaBot“ registrieren. --Tobias K. 20:46, 29. Jul 2006 (CEST)

Pro, ich find den Namen gut. – Simon Diskussion/Galerie 23:52, 29. Jul 2006 (CEST)
Pro – Finde ich auch angenehm. Klingt flüssiger als „NBSP-Bot“ und freundlicher als „PlenkBot“ oder Ähnliches. Christopher 14:47, 30. Jul 2006 (CEST)


Ok, anscheinend besteht ja Einigkeit, also habe ich jetzt einen Benutzeraccount für ComillaBot angelegt. Die Seiten mit dem Code und dem Testtext finden sich jetzt auch dort. Um die Kontinuiät der Diskussionen zu wahren: Bereits angefangene Fragestellungen HIER weiterdiskutieren (die Seite werde ich später ins Diskussionsarchiv von Comilla übertragen), andere Themen – einige habe ich dort schon angeschnitten – in Comillas Diskussion. --Tobias K. 15:04, 30. Jul 2006 (CEST)


Organisation

Auf jeden Fall sollten wir offen für neue Operatoren sein, für einen halbautomatischen Bot braucht es schließlich auch menschliche Arbeitskraft. Ich würde folgendes Verfahren vorschlagen: Wer mithelfen will, meldet sich auf der Diskussionsseite und bekommt dann per Mail Comillas Accountpasswort zugeschickt, damit er loslegen kann. Der Code ist auf Benutzer:ComillaBot/Code ohnehin öffentlich einsehbar. --Tobias K. 14:58, 30. Jul 2006 (CEST)


Noch etwas: Artikelkorrekturen wird jeder völlig selbstständig durchführen. Wir sollten uns aber auf einen „Hauptbetreuer“ für Comilla einigen, der dann später beispielsweise den Antrag auf Botstatus stellt und in der Botliste als Ansprechpartner eingetragen wird. Sollen wir eine Wahl oder so veranstalten? --Tobias K. 15:08, 30. Jul 2006 (CEST)

Ich wähle dich :) – Simon Diskussion/Galerie 17:54, 4. Aug 2006 (CEST)

Na gut, ich werde mich mal daran machen, die Sache ins Rollen zu bringen – Botstatus beantragen, Benutzerseite erweitern… Die bisherige Diskussion wird bald ins Archiv verschoben. –Tobias K. 18:11, 20. Aug 2006 (CEST)

Technisches

Was wir auf jeden Fall brauchen, ist erst einmal ein funktionierender Bot. Hat denn jemand (außer mir) schon mal die Sache mit Pywikipediabot getestet? Wenn es alternative Vorschläge oder Probleme gibt oder ich eine Anleitung schreiben soll, sagt Bescheid! --Tobias K. 14:58, 30. Jul 2006 (CEST)

Anleitung gibt es jetzt unter Benutzer:ComillaBot/Anleitung. --Tobias K. 11:43, 1. Aug 2006 (CEST)

Zum aktuellen Stand: Das bislang implementierte Regelset arbeitet schon nicht schlecht, siehe den letzten Test an Benutzer:ComillaBot/Test, Vergleichsansicht hier: [[1]] (Dank an Flea für die zusätzlichen Testfälle). Meinungen zum derzeitigen Leistungsstand und zu möglichen Verbesserungen sowie Kommentare zur den organisatorischen Themen erbeten! --Tobias K. 11:12, 2. Aug 2006 (CEST)

Es gibt ein paar Aufgaben, bei denen Unterstützung hilfreich wäre:

1. Einheitensammlung komplettieren. Derzeit kennt Comilla nur einige wenige Einheiten zu Testzwecken. Wem Einheiten, Präfixe o.ä. einfallen: loslegen und ergänzen! (Keine Angst vor dem regulären Ausdruck am Schluss – den kann ich auch updaten, wenn nötig.)
2. Regeln dokumentieren. Die Aufgaben, die bereits implementiert sind (aus den Kommentaren im Code ersichtlich und auch aus den vorangegangenen Diskussionen bekannt), sollten auf der Benutzerseite unter der Überschrift Aufgaben schön aufgelistet und im Bedarfsfall kurz erläutert werden – nach Möglichkeit auch logisch sinvoll nach Aufgabenbereichen gegliedert. Schließlich sollen Besucher und Wiki-Admins auch wissen, was unser Bot so macht.
3. Ziemlich große Sache: Das Pywikipediabot-Framework hat gewisse Schwächen, wenn man es halbautomatisch einsetzen will. Zum einen ist die Anwendung eher anfängerfeindlich (da sie textbasiert ist und einiges an Installationen benötigt), zum anderen können Änderungen nur gruppenweise übernommen oder abgelehnt werden. Für vollautomatische Bots ist das in Ordnung, für unsere Zwecke wäre es aber eigentlich ideal, ein neues Programm zu schreiben, das sich auf betreute Ersetzungen spezialisiert und das eine grafische Benutzeroberfläche hat. So etwas wäre natürlich auch für andere Bots als unseren und für andere Zwecke geeignet. Ich wäre auch bereit, meine eigenen Programmierkenntnisse unterstützend beizusteuern. Wenn also jemand grundsätzlich bereit ist, sich da ranzusetzen – bitte zwecks weiterer Besprechung des Themas melden.

--Tobias K. 12:19, 5. Aug 2006 (CEST)

Hab da noch etwas interessantes gefunden: http://www.bipm.fr/en/CGPM/db/9/7/ --Flea 08:37, 11. Aug 2006 (CEST)

Falls sich jemand für den aktuellen Stand interessiert: Ich habe den bisherigen Code in ein Java-Programm integriert, da mich die bisherige Lösung mit Pywikipediabot nicht wirklich zufriedenstellen konnte. Sollte in ein oder zwei Tagen in einem akzeptablen und benutzbaren Zustand sein. Etwas inhaltliche Unterstützung wäre ganz nützlich bei den Abkürzungen: Ähnlich wie für die Einheiten habe ich eine Seite erstellt, um sie zu sammeln. Die Liste findet sich hier. –Tobias K. 19:16, 26. Aug 2006 (CEST)

Anfrage: Operatoren gesucht?

Hallo,

habe mich nach einem Kleinkrieg gegen "z.B."s in der deutschsprachigen Wikipedia auf die Suche nach effizienteren Methoden umgeschaut, dem Fehlerteufel Herr zu werden. Dabei bin ich auf Wikipedia:Bots gestoßen, wo ich auch schnell auf das ComillaBot-Projekt aufmerksam wurde. Die Aufgaben bzw. Funktionen des ComillaBots halte ich für sehr sinnvoll, weswegen ich dem unabdingbaren Vorschlag, mich hier zu melden, auch nachkommen möchte. Pro fehlerfreie Wikipedia. (Haha, das ist ja wie mit der Vollbeschäftigung...) -- Wampenseppl 23:48, 11. Sep 2006 (CEST)

Hallo Wampenseppl,
freut mich, dass du bei Comilla mithelfen willst!
Zur weiteren Vorgehensweise:
1. Ich werde versuchen, dich per ICQ zu kontaktieren, damit man die weitere Vorgehensweise besser absprechen kann.
2. Die Programmdateien (und spätere Updates) schicke ich dir als Mailanhang.
3. Bis der Botantrag durch ist, musst du Änderungen noch unter deinem eigenen Namen vornehmen.
--Tobias K. 11:02, 12. Sep 2006 (CEST)

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -