人工智能教你学英语的捷径

学英语的广告最近是铺天盖地,所以前排声明:本文为个人经验,非广告。首先我抛出一个人工智能领域的思想,

学习的捷径就在使用足够少的信息量以提供足够的丰富性,通俗一点就是我们要以最少的数据量以获取到最好用的模型,

举例来说就是砖头和墙的关系,

我们可以收集各种各样的砖头,有一个坑的,两个的…一百个的,20cm、20.01cm、20.001cm的,无穷无尽。

构建起来的结构,如图所示,不稳当,且工作量巨大。

我们也可以思考,砖头有哪些关键共性,然后以最少的信息量获取到最优秀的模型:

具体到本文,这也意味着很多与此概念无关的、好的英语学习方法,就像…是五彩斑斓黑的砖头,很有意思,但我不会在文中进行介绍,

当然如果你还是看不懂这句话,无法理解这个伟大的思想。没关系,我们下面会举例子说明,

why

为什么要学英语?因为感知到了问题:

一、最早是在编程学习中对陌生函数的记忆

multiprocessing这个函数,想象一下,当我需要一个多线程函数,有两种路径:

1、multi(多)+processing(处理)=多线程函数

2、这个函数的开头是m+u+l+t+i+p+r+o+c+e+s+s+ing

哪一个对记忆的负担小,且对函数功能提供理解?

当然是前者,后者除了死记硬背,你还需要通过大量的案例实践,以获得对这个函数相对直观的感受,即便如此,如果长时间不训练会被遗忘。影响我学习。

二、搜索引擎查询

同样是这个函数,当时我写了一个逻辑上没有问题的代码,但是运行出了问题,用中文在百度查询不到结果,在谷歌用英文解决了问题,举个例子:

我尝试国外某软件的高级搜索功能,一输入语法就报错,在百度上找了2小时,没有答案,去官网查询文档,照着案例写,没有答案。

最后用谷歌搜索,五分钟找到了对应案例,解决问题。我用selenium爬取网页很封ip,然后我去百度,怎么换ip,给我的答案是这样的:

我一改红框中的ip就报错,还tm是斯金纳的错误,有时能用,有时不能,之后我不停的修改,查询网站,发现基本全网都是相互抄的这个案例,当很多人认为这个有用,我都怀疑自己智商低了。

5小时后……上不存在的网站,搜索:selenium ip终于找到和国区不同的案例:

一次解决问题。

为什么中文搜索的质量比英文低这么多?当然不是怪百度,百度解决不了内容提供者的问题。可能是问题对应的人群范围的问题,比如用国外软件,英语门槛劝退了一大票人,比如写代码,虽然上手的英语水平门槛低,但长期变量名用拼音、看不懂英文文档,又劝退了一票人。

等等。就不深究了,我们这是在吐槽,不是写议论文。

三、近期我在看一些ai前沿的视频,机翻的内容根本看不懂

以上三条就足够我作出学习英语的决策,如果你并没有这种内在的驱动力,但你又认为自己应该去学习,我提供你一个方法,通过制造不便来构造需要学习的欲望,举例来说,

比如崔宁公司都不和我说中文,如果无法通过英文表达,那么我就只能憋着怎么办?我就会像一个幼儿一样,为了表达自己的想法,而去尽可能的说。

how

一、基于音标对单词读音的记忆,而非一开始就记每一个单独单词的发音我们只需要记住48个音标,然后重复使用,直到熟练就够了。

二、基于句子,听说读写,比如 we are expecting our first bably,对单词意思进行理解:

我们期待我们的第一个孩子。

同时学习该例句的语法:恩,这句话没啥特殊语法。以及标注例句中的生词供之后学习:expect

当我们学习例句中的生词expect后,该例句又成为支撑该单词expect语义的一根支架。我可以少学一个例句。

what

基于python脚本,此部分我花了一个月的时间,一半是在比较各种流程的优劣后,构建优势流程:最初我使用的例句是从某词典爬出的英美剧例句,听着各种腔调的简单例句很有意思,但问题很大:

不是每一个释义都有对应的美剧例句,不同的口音增加了我学习的信息量,也就是说相互无关联的砖头变多了。思考后,我把音源统一换成了谷歌,从例句到单次发音均是如此。此时又存在一个问题,当我熟悉了合成发音后,我又该如何面对真实场景的对话呢?所以我又构建了另一套学习流程,作为补充:

他不用来学习新单词,而是使用美剧例句让我识别这句话是在说什么。此时我重新定义了美剧例句的价值:不是学习新知识,而是换着花样的复习。就像教科书之外的,五年高考三年模拟。

另一半是自动化流程

之前的流程:阅读一句话-发现了陌生单词-复制进牛津英汉词典-复制音标-放入csv表格供之后学习-开启下一个循环

改:

复制-自动打开百度或有道获取语义并显示-筛选出本语境下所需要的释义-音标自动写入剪贴板-我一个CTRL+v就能写好笔记

如图:

此外还有很多繁琐的事情,比如音标的结尾如果是”:”,比如per这个单词程序就会报 错,需要我修改逻辑。这种只能通过长期使用才能发现问题,这又印证了互联网圈快速测试的理念。

如何偷懒是对的?在保证输出质量的前提下,尽可能减少信息的输入。这个解释是不是更通俗些?



评论