来源时间为:2021-10-02
网站里你每输入一次验证码,就被割了一次韭菜,被吓到了吗?
2021-10-0201:47:27来源:
至
用微信扫码二维码
至好友和朋友圈
你每输入一次验证码就被割了一次韭菜,这是咋回事呢?每次我们在网站里输入验证码的时候,会发现这个单词特别难认,但是呢,只要有十个人里面有一个人输入正确了,那就等同帮系统识别了一个古籍单词,因为做古籍数字化又难又费钱,靠机器识别准确率极低,交给专家一套资治通鉴靠人力识别全部内容就得花十年,所以欧盟的资本家把古籍词做成了验证码,让万亿网民来打工,不得不说资本家不管在哪个行业里面都是精明的厉害。
但是呢,咱们中国不搞这一套,阿里达摩院为公益项目助力,专门开发了古籍识别算法,手把手教AI识别古籍中的文字,那么他们是通过什么方式做到的呢?
首先把古籍中每个字都抠出来,单独做成一张图,然后把重复字归为同个字类,再交给专家标注,本来人工识别10万字的工作量,现在只需为两三千个字类打上专属标签即可。
接下来,AI会把所有的字类重新标识并打上标签,如果AI认证结果与上一轮的聚类一致,就判断字类标签正确,不一致则回到上一轮重来。
达摩院用技术推动古籍数字化,在两年内将首批20万页海外古籍的识别准确率从40提高到了97.5,实在无法识别的生僻字AI将会主动找出来,让人类来打标,而不是做出验证码骗人类来打工,至于为啥要这样干,也许去问问国外各大博物馆啥时候把中国古籍还回来。