随着GPT的问世,AI工具在人类社会中的应用大幅扩展,特别是在文本处理、信息检索、图片生成等领域极大地提升了生产力和工作效率。那么,从整个人类历史发展的角度观察,AI工具的出现具有怎样的意义,又会产生怎样的影响呢?作为个体,又应该如何在这一AI浪潮中找到发展方向呢?在这篇文章中,我将整理过去一段时间对上述问题的思考,供后续参照。
认知迭代整理(2023)
在过去的一年中,我在工作的关注点仍然主要在组织和项目管理上。在过程中,我接触到一些相关的管理工具,积累了一些实践经验,并对其适用性和使用方式进行了一些思考:例如,这些管理工具能否适用于更一般场合,例如对个人的进展进行跟踪记录呢?在这篇文章中,我将针对OKR这一工具,对过去一段时间的使用经验和思考进行总结,供后续参考。
下面的讨论将分为三个部分。首先,我将简要介绍OKR工具的基本框架和应用方法。其次,我将分享一些个人的应用心得和理解。最后,我将对该工具的局限性进行讨论。
认知迭代整理(2022)
在过去的一年中,随着角色的转变,我在工作中的关注点逐渐从具体问题的解决方法转移到组织的运作方式上。具体来说,随着工作内容的规模和复杂度增加,单个个人贡献者已经无法满足产出要求,需要引入组织来完成执行工作。但由于组织是由多个个体组成的,而个体之间动机和诉求各异,因此组织的运作模式会对组织效率产生一定影响。在这篇文章中,我将对过去一段时间的观察经验进行总结,并梳理出一组实践原则,供后续参考。
下面的讨论将从个体行为理解的角度出发,基于数个观察到的组织问题进行分析。特别地,我们将讨论目标制定与执行中的进取程度问题、项目资源分配中的多目标取舍问题、以及多部门协同和组织文化设计中的透明度问题。
Decision Behavior Note II: Value Estimation
最近,我对一系列经典的研究人类决策行为的书籍进行了学习,并尝试从决策学习算法设计的角度进行分析解释。在下面这一系列文章中,希望通过对上述这些学习和分析进行整理,我们能够一方面更好地认识到人们决策行为中的局限性和相应的校正方法,另一方面为自动化决策算法的设计和优化提供新的思路。
在这份笔记中,我将对Choice, Values, and Frames这本关注价值判断的书中的主要结论进行整理。
Decision Behavior Note I: Probability Judgement
最近,我对一系列经典的研究人类决策行为的书籍进行了学习,并尝试从决策学习算法设计的角度进行分析解释。在下面这一系列文章中,希望通过对上述这些学习和分析进行整理,我们能够一方面更好地认识到人们决策行为中的局限性和相应的校正方法,另一方面为自动化决策算法的设计和优化提供新的思路。
在这份笔记中,我将先对Judgement under Uncertainty: Heuristics and Biases这本关注概率判断的书中的主要结论进行整理。
Regret Minimization Methods
在算法博弈论中,一个核心的课题是如何对于给定的问题求解均衡。近期,我粗略地学习了CMU 15-888这门课程,该课程的前一部分从理论的角度,回顾了均衡求解、遗憾值最小化、Blackwell Approachability等概念之间的联系,为理解相关方向的前沿进展提供了很好的基础框架。在这篇文章中,将对该课程中提到的主要结论进行简单整理和总结。
Gaussian Processes (GP) and Extensions
高斯过程(Gaussian Process,下称GP)是机器学习/贝叶斯学习中的一种常见建模方法。由于GP不但能给出预测值,还能给出预测的不确定性,因此在许多实际场景(包括参数优化等)都有广泛的应用。近期,随着深度神经网络(Neural Network,下称NN)的兴起,也逐渐出现一些将GP与NN相结合的工作,一定程度上提升了GP的可用性(applicability)。在这篇文章中,我将对近期对GP及其扩展的学习做一个简单的整理。
认知迭代整理(2021)
在这篇文章中,我将对过去一年来在数据挖掘与应用方面的一些思考和实践进行整理。主要的背景和动机是,在之前的一段时间内,由于路径依赖等原因,我更关注在给定一个决策问题时,如何通过技术手段提高决策效率;而近期的一些实践经验表明,在实际业务场景中,如何找到数据、并从数据中挖掘出有价值的决策问题,其实也很重要。
下面的讨论将分为三个部分。首先,我们讨论在给定一组数据集的情况下,如何更好地挖掘有价值的信息。其次,我们讨论在给定多组(可能相关的)数据集的情况下,如何针对不同的应用场景对数据进行提炼。最后,我们讨论如何在现有数据集的基础上,寻找更有价值的增量数据。
Counterfactual Regret Minimization (CFR)
Counterfactual regret minimization(下称CFR)是目前针对不完全信息博弈问题的一类主流求解方法,在棋牌类游戏中有较为广泛和成功的应用。理解这类算法的思路和性质,将有助于后续对一般的不完全信息博弈问题的研究。在这篇文章中,我将对近期对CFR的学习做一个简单的整理。内容主要包括:
- 对原始的CFR算法及其经典变种的简单实现,以及实现过程中遇到的一些问题点和注意点;
- 对CFR算法思路的一些个人理解,以及后续拓展方向的思考;
- 通过一个简单的测试问题(Leduc纸牌游戏),对实现的算法的效果进行仿真评估;相应的代码仓库地址在这里。