从泰坦尼克项目中,学习数据处理

前言 学习机器学习也有一段时间了,在这段时间内,有很多感想,其中之一就是数据处理的重要。在机器学习中,一般使用pandas进行数据的处理,使用matplotlib或者seaborn进行图形化数据,两者结合起来处理和分析数据,能让之后的步骤事半功倍。用来学习的项目是kaggle上的项目,有很多人分享了 阅读更多…

Cost Function

代价函数,通常用来判断模型的拟合程度。 其中有一个方差公式,应该都能看出来,通过方差来进行拟合的衡量。但是让人疑惑的就是为什么是方差的 呢,其实这个 完全是为了之后计算方便而设置的,因为之后求导,能够把这个 抵消,方便之后更好的进行计算。

LeetCode 72. Edit Distance

LeetCode 72. Edit Distance 题目:给定两个单词,将第一个单词转换成第二个单词,需要的最少的步数。其中:替换,删除,增加都算是一个步数。 思路:不知道为啥这题标为难,其实也是超级简单的题目,唯一需要动一点脑子的,就是删除的那个操作,第二个单词的下标是不需要往前移的。比较值得注 阅读更多…

python中的defaultdict

在一个需求中意外的发现了defaultdict这个东西,python中的dict很好理解,可是有一个使用起来不方便的地方在于,需要进行初始值是否初始化的判断: list = [“aaa”, “bbb”, “ccc”, “aaa”] kv = {} for d in list: if d in kv: 阅读更多…