构建高质量的信息输入渠道

2021-07-25

本文聊聊我的信息输入渠道。为什么要聊这个话题？是因为信息源是一个人在信息社会存在的基础。人是社会性的物种，一个社会人对信息是有强烈需求的，而信息源会影响你的行动决策。一个低效低质量的信息渠道可能会让你做出很多错误的决策，以至于会让你形成错误的认知。从认知的角度讲，高质量的信息输入渠道的建设是优先级很高的事情，但诡异的是，很多人却对此投入甚少，甚至选择性忽视掉。

我在构建终身学习体系进行自我提升中介绍过信息输入的不同渠道，所以这期邮件主要分享如何构建一个高效、高质量的信息输入渠道。

什么是信息输入

我对信息输入的理解是人对某个外界事件的反应行动，这定义包含三个要素：人、外界事件、反应行动。外界事件可以是一个客观物体的存在事件，也可以是对某个事物与人的评价或一个抽象的概念。总之人接触到这些事件后会产生一些反应行动。这些行动可能是经过大脑思考的交流，可能是一个收藏行为，也可能是一个待办任务的制定，但重要的是一定要有反应行动。如果某个外界事件对人毫无反应行动的产生，那就不能算是信息输入。

信息获取的方式

主动方式

主动获取信息很类似于健身，你需要不断的锻炼才能让身体变得更健康。

搜索技能：搜索引擎我一般用 Google，如果没法使用 Google 的话我会选择用 Bing 或 DuckDuckGo 搜索中文信息。一些高级搜索技巧见 Google高级搜索。
订阅：订阅最重要的是找到你认可的作者，然后订阅他们的公众号、邮件列表或频道（杂志、专栏或视频）。我的订阅策略是通过一些搜索渠道或他人推荐的方式先找到一批种子订阅号，之后通过这些号的推荐找到更多的作者。
阅读：阅读是最古老的主动获取信息（知识）的方式，早期是书籍的形式，现在可能是博客之类的内容形式。在阅读的方式上，我建立了自己的书单。我按照关注的几个主要领域如技术、投资、历史及综合分类，通过其他人推荐或者主动搜索相关领域的推荐书单的形式，构建了我的阅读清单。之后设定阅读计划，通过听书或看书的方式吸收书里的信息。

被动方式

被动获取信息很类似于通过看电视购物里的减肥广告，期望获取躺着减肥的神奇方法。

算法推荐：现代互联网通过古老的机器学习算法构建了以短视频和推荐信息流为主的信息产品，这类产品类似于减肥药，吃多了容易反弹。推荐算法一个很大的问题会制造出围绕使用者的信息茧房，也就是用户最终看到的都是自己喜欢看到的信息，信息单一化让使用者看到的都是片面的信息，这对提升认知来说是个灾难。
社交信息流：社交是古老的被动获取信息的方式，比如你在朋友圈子或社交媒体上看到一些八卦的信息。这种信息获取方式最大的问题在于封闭的圈子，如何破圈是关键。举例来说，你是一个程序员，你周围的人大多也是程序员，由于共同的思维方式，你得到的信息也大多是同一类，信息在平流层流动。如果你想了解一些投资的知识，很难找到金融圈的从业人员。我的解决方法是通过不断学习不同领域的知识来认识一些我重点关注领域的人，比如我在学习金融知识的时候会考取一些投资资格证，以及写一些和金融相关的文章，看起来是种很慢的方式，但效果却不错。另外写作是破圈的利器，写作也是高质量的社交方式，作者很容易通过一篇文章破圈。

信息质量反馈机制

信息输入是一个墒增的过程，高质量的信息渠道需要不断的投入时间维护，砍掉无用信息的渠道，增加新的高质量的信息渠道。因为我们时间有限，能接受信息的带宽有限，提升信息输入质量的关键在于砍掉低质量的信息渠道，难点在于如何发现低质量的信息渠道。我一般采用以下几种方式解决这个问题：

全面获取信息，交叉对比：面对一个陌生的领域，第一步我会通过主动获取信息的方式获取到一定量的信息。然后对这些信息做交叉对比。比如一篇文章，如果我认可的多个作者都推荐，我会仔细阅读并获取更多的信息。如果一个观点，不同的人有不同的看法，我会进一步去思考是否接受或者优化这个观点带来的认知。正确的决策需要全面的信息，虽然这个全面也是相对意义上的全面，但对于进一步的行动来说足够就行。
区分事实与观点：事实是一件事客观的信息存在，虽然有时候我们无法得知真正的事实，看到的可能是别人精心准备的伪造事实。观点是人对事实的思考结论。这两者很容易混淆，尤其是在现代信息爆炸的互联网，我们很容易误把观点当事实。我的解决方法是找到不知道传了多少手信息的最早来源，通过一些搜索技巧，不少信息还是容易找到最早的来源。之后确定这个信息来源是观点还是事实，然后做出自己的反应行动。
正视偏见：偏见害死人，我们对自己坚持的观点很容易选择性忽略一些重要的信息，做出完全错误的反应行为。正视偏见也是正视自己，我们生来就带有很多偏见，我们生长的环境处处存在偏见，要做到完全无偏见的做事是一种修行。同样的信息对于带有不同偏见的人来说可以产生完全不同的认知，所以面对有对立的观点的信息，先不要立即下定论，而是确定是否自己对此观点持有偏见。
通过输出与人交流：信息输入好不好，很难直接评测。但通过对此信息的输出，与人交流观点，可以从他人处得知信息输入的质量好坏。通过输出的反馈去提升输入的质量。如果输入的信息源是错误的，我可以从持有正确输入信息源的人的反馈中得知，从而有机会去修正它。

基于信任度的信息输入渠道建设

我们在使用 Google 搜索相关关键词的时候，Google 会对海量网页进行 PR 排名，排在第一的页面就是关于此关键词匹配度最高的页面。海量的页面拥有海量的信息，其中很多都是低质量的干扰信息。Google 使用的是 PR 算法，简单的说就是指向网页的每个链接都是对这个页面的投票，这点类似于文献引用，不过存在的问题是垃圾页面可以通过伪造链接的方式欺骗搜索引擎。这点可以理解为热门的信息质量不一定高。

如何解决这个问题呢？2004年，雅虎和斯坦福大学发布了一篇名为 Combating Web Spam with TrustRank 的论文。论文提出从一系列被信任的种子网站（由人工审查选取）开始执行 PR 值计算。这种降低垃圾信息影响的方法就叫网站的信任度。

通过信任度来解决信息输入质量差的问题，比如我会设置一些重点关注的不同领域的作者列表，对于他们的推荐我会优先关注。

信任度的反面就是黑名单机制了，李笑来老师曾说过“ S.B. 的共识也是共识”，所以我有个黑名单列表，一旦通过一定时间的观察觉得此信息来源非常不可靠，我会找出和这个信息来源相关的来源，共同加入黑名单。

通过不断的信任与拉黑不同信息源，这个过程相当于训练一套高质量的信息输入系统，相比算法推荐这类弱人工智能的训练方式，这算是真人工智能的训练方式了。

除了黑名单外，还有一种奇妙的方法如下：

高效的信息渠道

付费和自动化是我构建高效的信息渠道的两种方式。

付费：好的信息值得付费，比如某些高质量的杂志或邮件列表，这种信息渠道已经经过编辑精心整理，非常高效的把有用的信息传递给人。
自动化：我会通过一些自动化的方式监控某些信息源，定时将信息通过邮件发送给我。自动化的方式有很多种，比如通过 IFTTT 或 GitHub Actions 自动抓取数据并发送提醒通知。

信息审查的影响

谁控制过去就控制未来；谁控制现在就控制过去。（一九八四）

信息审查会导致信息失真，一旦信息失真，会让我们做出不可预知的决策。解决这个问题的办法很简单，主动去搜索不同语言不同地区对同一件事的报道，对比分析大概能分析真实的事情走向。

虽然信息可以被篡改，但互联网有记忆。对于数字化的信息很难被彻底从整个互联网同时篡改了，所以找到这些不同时期的版本对比就能做一些分析。有个号称互联网时光机的网站叫 Wayback Machine，它会不断的爬取并备份整个互联网公开的信息，浏览器安装它的插件后当访问某个被删除的页面时会自动找到最近的归档版本，还能查看这个页面的修改记录。如果一个新的网页可能会被某些神秘的力量删除时，可通过插件备份整个页面，这样所有的人都能看到它的历史版本了。

这篇文章是 BMPI.dev 第三期的邮件通讯，之前两期见这个归档。邮件订阅是一种古老而高效的获取信息的方式，甚至很难受到网络不可访问或内容审查的影响。所以如果你觉得本文不错的话，可以订阅我的邮件列表，一些敏感而不方便公开的内容我会选择邮件列表的方式发表。