维基百科:机器人/申请/Cewbot/11

Cewbot 11

本次申请为d:WD:Requests_for_permissions/Bot/Cewbot之附属功能。Kanashimi留言2016年4月15日 (五) 12:06 (UTC)[回复]

 测试编辑?这个好像就是Antigng-bot/3 + Liangent-bot的感觉?--Jimmy Xu 2016年4月15日 (五) 17:24 (UTC)[回复]
主要集中在 [[:l:t|T]]轉成[[T]]。先测试了一点点Kanashimi留言2016年4月17日 (日) 14:54 (UTC)[回复]
不赞成直接把链接文本替换成条目名。--Jimmy Xu 2016年4月17日 (日) 17:34 (UTC)[回复]
现在采:
  • [[:en:Day|地球日]] → [​[日|地球日]]
  • [[:en:Day (disambiguation)]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|日]] → [​[日 (消歧義)|日]]
  • [[:en:Day (disambiguation)|Day]] → [​[日 (消歧義)|日]]
  • [[:en:Day]] → [​[日]]
  • [[:en:Day|日]] → [​[日]]
  • [[:en:Day|Day]] → [​[日]]
  • [[:en:First Last|First]] → [​[中文全名]]
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名]] (译名已汇入 wikidata aliases)

您的意见如何?--Kanashimi留言2016年4月18日 (一) 10:50 (UTC)[回复]

一般说来,有机物分子在中红外区有着强烈的吸收,因而红外线具有明显的热效应。--Antigng留言2016年4月18日 (一) 13:21 (UTC)[回复]
我总觉得这是错用了,应该改的是原文本...这种情况下有正当使用的例子吗?Kanashimi留言2016年4月18日 (一) 13:30 (UTC)[回复]
所以不能错上加错。--Antigng留言2016年4月18日 (一) 13:32 (UTC)[回复]
不如加上个侦错功能Kanashimi留言2016年4月18日 (一) 13:34 (UTC)[回复]
举个例子,明武宗“但是也有人认为武宗追求个性解放,刚毅果断,弹指之间诛刘瑾,平安化王、宁王之叛应州大败小王子,是极具个性色彩的皇帝。”如果后面两个链接是跨语言的,就不能转成中文全名。--Antigng留言2016年4月18日 (一) 13:37 (UTC)[回复]
改成于应州大捷大败达延汗? 或者
  • [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [​[中文全名|無論是什麼奇怪譯名]]

...? 只是我想奇怪译名的情况会远多于特殊状况...Kanashimi留言2016年4月18日 (一) 13:58 (UTC)[回复]

@Kanashimi测试了一点点 的想办法过滤出来,现在根本看不出测试了什么。Liangent留言 2016年4月18日 (一) 18:00 (UTC)[回复]

已测试。烦请看看有何需要改进之处。Kanashimi留言2016年4月21日 (四) 09:22 (UTC)[回复]
[1])随便点开就看到一个不恰当的……[2]Liangent留言 2016年4月22日 (五) 04:18 (UTC)[回复]
有很多类似的[[中文名]],原名/简称/英文/缩写为[[:en:XXX|XXX]],感觉这么暴力清理真的不是很合适。Liangent留言 2016年4月22日 (五) 04:26 (UTC)[回复]
若是以/原名|[文簡简縮缩]|tfrom/以及其他已发现的模式来筛选连结的前后文,您觉得是否可行呢?或者您是怎么处理原文:{{lang-en|...}}的呢?可否让我们借镜一下 :) Kanashimi留言2016年4月22日 (五) 07:48 (UTC)[回复]
free-form text的我不管……我只处理明确使用了tsl或ilh模板的。Liangent留言 2016年4月22日 (五) 19:07 (UTC)[回复]
谢谢您的意见。这边会考量前后文以后再行测试。以及,或许我们可以把原文:abc改成英语:abc以至之类?我想这是可以在扫描的时候一并完成的。Kanashimi留言2016年4月22日 (五) 23:32 (UTC)[回复]
已做新的测试。再麻烦看一下有无问题。Kanashimi留言2016年4月27日 (三) 16:01 (UTC)[回复]
[3],我真觉得试图去parse自然语言写的内容不太靠谱……Liangent留言 2016年4月29日 (五) 21:53 (UTC)[回复]
经过处理了几百个例子后,发现因为不能确定前面的一定是泛用的翻译,上面这种转换法似乎已是最好的处理方式了。这样提供了人类编辑时一个好的参考,而且想看中文的就能简单阅览。未知您的意见如何?Kanashimi留言2016年4月29日 (五) 22:46 (UTC)[回复]
已做了近2K次测试,现在颇稳定了。再麻烦确认一下。Kanashimi留言2016年5月2日 (一) 10:52 (UTC)[回复]
随便在贡献里点了几个都能发现不适当的,这种东西要么人工一个一个核对,要么请只清理显式应用了ilh模板的。还有这是在干什么?--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回复]
未完成,如上讨论。--Jimmy Xu 2016年5月3日 (二) 03:40 (UTC)[回复]