生啃Transformer算法论文《Attention is All You Need》(ChatGPT底层运用的算法)时,我有些懵——怎么就把一种语言文字变成数字向量,经过矩阵计算得到数字,又转成另一种语言文字的?这个算法一开始是为更好的机器翻译而设计的。我拉上我姐一起看,然后她给我分享了《数字之美》这本书。
看完第二章“自然语言处理:从规则到统计”时,突然就豁然开朗了!!!统计学里的概率太妙了——只要统计得足够多,就能知道“知”后面出现“道”的概率有多大。延展开来,一句话“能让人看懂”的概率有多大,也是能够算出来的。也就是说Transformer也好,以及之前的RNN、CNN算法也好,都是建立统计概率模型,找到概率最大的那个词序列。
书中非常多的数学公式,其中出现频率最高的就是概率计算。这不禁让我联想:我能否把“统计概率思维”运用到自己的人生决策上。比如,决定是否和一个人认真交往。没有谁的爱情能100%走到最后,但可以根据相处中的点滴信号——三观是否契合、沟通是否顺畅、遇到矛盾时对方的态度——不断更新“幸福概率”。如果综合下来有70%的把握觉得合适,那就可以定下来了。人生有三万天,而我面对的现实世界充满不确定性——这些都可以看作“大数据”,与“概率”息息相关。
当然,概率不是万能的,很多事情无法用概率高低去衡量好坏:1+1=2是确定的;一段友谊的价值,也不能用概率分布去描述。但这本书给了我一种新的思维方式,在不确定的世界里,最好的活法不是追求确定性,而是学会计算期望、接受随机、持续更新。与不确定性共舞,不是消灭它,而是找到与它共存的节奏。
观点仅代表个人思考