维基百科:机器人/申请/Cewbot/11

Cewbot 11

本次申請為d:WD:Requests_for_permissions/Bot/Cewbot之附屬功能。Kanashimi留言2016年4月15日 (五) 12:06 (UTC)[回复]

 测试编辑?这个好像就是Antigng-bot/3 + Liangent-bot的感觉?--Jimmy Xu 2016年4月15日 (五) 17:24 (UTC)[回复]
主要集中在 [[:l:t|T]]轉成[[T]]。先測試了一點點Kanashimi留言2016年4月17日 (日) 14:54 (UTC)[回复]
不赞成直接把链接文本替换成条目名。--Jimmy Xu 2016年4月17日 (日) 17:34 (UTC)[回复]
現在採:
  • [[:en:Day|地球日]] → [​[日|地球日]]
  • [[:en:Day (disambiguation)]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|日]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|Day]] → [​[日 (消歧義)|日]]
  • [[:en:Day]] → [​[日]]
  • [[:en:Day|日]] → [​[日]]
  • [[:en:Day|Day]] → [​[日]]
  • [[:en:First Last|First]] → [​[中文全名]]
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名]] (譯名已匯入 wikidata aliases)

您的意見如何?--Kanashimi留言2016年4月18日 (一) 10:50 (UTC)[回复]

一般说来,有机物分子在中红外区有着强烈的吸收,因而红外线具有明显的热效应。--Antigng留言2016年4月18日 (一) 13:21 (UTC)[回复]
我總覺得這是錯用了,應該改的是原文本...這種情況下有正當使用的例子嗎?Kanashimi留言2016年4月18日 (一) 13:30 (UTC)[回复]
所以不能错上加错。--Antigng留言2016年4月18日 (一) 13:32 (UTC)[回复]
不如加上個偵錯功能Kanashimi留言2016年4月18日 (一) 13:34 (UTC)[回复]
举个例子,明武宗“但是也有人认为武宗追求个性解放,刚毅果断,弹指之间诛刘瑾,平安化王、宁王之叛应州大败小王子,是极具个性色彩的皇帝。”如果后面两个链接是跨语言的,就不能转成中文全名。--Antigng留言2016年4月18日 (一) 13:37 (UTC)[回复]
改成於应州大捷大敗达延汗? 或者
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名|無論是什麼奇怪譯名]]

...? 只是我想奇怪譯名的情況會遠多於特殊狀況...Kanashimi留言2016年4月18日 (一) 13:58 (UTC)[回复]

@Kanashimi測試了一點點 的想办法过滤出来,现在根本看不出测试了什么。Liangent留言 2016年4月18日 (一) 18:00 (UTC)[回复]

已測試。煩請看看有何需要改進之處。Kanashimi留言2016年4月21日 (四) 09:22 (UTC)[回复]
[1])随便点开就看到一个不恰当的……[2]Liangent留言 2016年4月22日 (五) 04:18 (UTC)[回复]
有很多类似的[[中文名]],原名/简称/英文/缩写为[[:en:XXX|XXX]],感觉这么暴力清理真的不是很合适。Liangent留言 2016年4月22日 (五) 04:26 (UTC)[回复]
若是以/原名|[文簡简縮缩]|tfrom/以及其他已發現的模式來篩選連結的前後文,您覺得是否可行呢?或者您是怎麼處理原文:{{lang-en|...}}的呢?可否讓我們借鏡一下 :) Kanashimi留言2016年4月22日 (五) 07:48 (UTC)[回复]
free-form text的我不管……我只处理明确使用了tsl或ilh模板的。Liangent留言 2016年4月22日 (五) 19:07 (UTC)[回复]
謝謝您的意見。這邊會考量前後文以後再行測試。以及,或許我們可以把原文:abc改成英語:abc以至之類?我想這是可以在掃瞄的時候一併完成的。Kanashimi留言2016年4月22日 (五) 23:32 (UTC)[回复]
已做新的測試。再麻煩看一下有無問題。Kanashimi留言2016年4月27日 (三) 16:01 (UTC)[回复]
[3],我真觉得试图去parse自然语言写的内容不太靠谱……Liangent留言 2016年4月29日 (五) 21:53 (UTC)[回复]
經過處理了幾百個例子後,發現因為不能確定前面的一定是泛用的翻譯,上面這種轉換法似乎已是最好的處理方式了。這樣提供了人類編輯時一個好的參考,而且想看中文的就能簡單閱覽。未知您的意見如何?Kanashimi留言2016年4月29日 (五) 22:46 (UTC)[回复]
已做了近2K次測試,現在頗穩定了。再麻煩確認一下。Kanashimi留言2016年5月2日 (一) 10:52 (UTC)[回复]
随便在贡献里点了几个都能发现不适当的,这种东西要么人工一个一个核对,要么请只清理显式应用了ilh模板的。还有这是在干什么?--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回复]
未完成,如上讨论。--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回复]