SVM笔记

基本 目前看来svm是逻辑回归的优化版本,优化了效果和计算量。 svm使用了另外一种cost function,他的参数放到了前面,改成了 ,这个C就是参数,相当于以前的 ,如果C很大,那么就需要让A尽可能的小,那么A要趋近于0. A是由 cost1 和 cost0 相加组成,也就是说 cost1 阅读更多…

Flask最简部署

从能在服务器直接运行flask的情况下开始说起,使用的是nginx+uWsgi方法部署flask。 首先安装uWsgi,使用pip install uwsgi安装。 nginx怎么安装网上很多文章不说了。 在项目的根目录建立uwsgi的配置文件uwsgiconfig.ini,配置中如下填写 [uws 阅读更多…

ELI5:导数,偏导数

导数 导数就是描述某个事物的变化速率。 举个最常见的例子,当人从某地移动到另一地点的时候,速度就是这个移动的导数,因为它描述了移动的变化速率;再继续看,加速度就是速度的导数,因为加速度描述了速度的变化速率。当加速度恒定的时候,我们可以想到,速度就是一条斜线,再进一步就能想到移动的距离是一个抛物线。 阅读更多…

写高性能的Pandas代码

写高性能的Pandas代码 我觉得吧,python作为科学计算的最常使用语言之一,应对大量的数据计算,如果太慢了,会让需要不断试错的科学计算方法消耗过多的时间。所以我常常在思考,python到底有多慢,让大家一开始用就觉得它慢?又有多快,让大家都用它来进行上GB数据的计算? pandas是用来处理科 阅读更多…

从泰坦尼克项目中,学习数据处理

前言 学习机器学习也有一段时间了,在这段时间内,有很多感想,其中之一就是数据处理的重要。在机器学习中,一般使用pandas进行数据的处理,使用matplotlib或者seaborn进行图形化数据,两者结合起来处理和分析数据,能让之后的步骤事半功倍。用来学习的项目是kaggle上的项目,有很多人分享了 阅读更多…

Cost Function

代价函数,通常用来判断模型的拟合程度。 其中有一个方差公式,应该都能看出来,通过方差来进行拟合的衡量。但是让人疑惑的就是为什么是方差的 呢,其实这个 完全是为了之后计算方便而设置的,因为之后求导,能够把这个 抵消,方便之后更好的进行计算。

LeetCode 72. Edit Distance

LeetCode 72. Edit Distance 题目:给定两个单词,将第一个单词转换成第二个单词,需要的最少的步数。其中:替换,删除,增加都算是一个步数。 思路:不知道为啥这题标为难,其实也是超级简单的题目,唯一需要动一点脑子的,就是删除的那个操作,第二个单词的下标是不需要往前移的。比较值得注 阅读更多…