本系统为@牛旦教育IT课堂在微头条上的内容,
为便于查阅,特辑录于此,都是常用SQL基本用法。。
2024年10月04日
在关系数据库的世界里,重复(行)和 NULL 一样,都不受欢迎 A。人们想了很多办法来排除掉重复(行)。如下图一张商品表,现在假设在这张表里,“橘子”这种商品存在重复。可怕的是,这张表里连主键都没有(其实是根本没法设置主键)。我们现在就需要马上清理一下,去掉重复(行)。
-- 删除重复行 :使用关联子查询
DELETE FROM Products
WHERE rowid < ( SELECT MAX(P2.rowid)
FROM Products P2
WHERE Products.name = P2. name
AND Products.price = P2.price ) ;
2024年10月04日
在MySQL中,删除数据表是一个相对简单的操作,但也是一个需要谨慎处理的操作,因为它会永久删除表及其包含的所有数据。以下是如何在MySQL中删除数据表的详细步骤:
2024年10月04日
DELETE 语句用于删除表中的行。
WHERE 子句控制删除数据的范围,若无 WHERE 子句,表中所有的数据都将被删除。
现在,我们希望把 Students_hobby_t 中 Age 小于16的学生信息删除,如下
2024年10月04日
本文作者将常用的损失函数分为了两大类:分类和回归。然后又分别对这两类进行了细分和讲解,其中回归中包含了一种不太常见的损失函数:平均偏差误差,可以用来确定模型中存在正偏差还是负偏差。
选自towards data science,作者:Ravindra Parmar,机器之心编译,参与:李诗萌、王淑婷
2024年10月04日
逻辑回归是一种预测分析,解释因变量与一个或者多个自变量之间的关系,与线性回归不同之处在于它的目标变量有几种类别,所以逻辑回归主要用于解决回归问题。逻辑回归实际上是一个概率分类模型,产生0和1之间的p值。
2024年10月04日
Box–Muller 变换是一种快速产生符合标准正态分布随机数对的一种方法。基本思想是先得到服从均匀分布的随机数,再将服从均匀分布的随机数转变为服从标准正态分布(零期望,单位方差)的独立的随机数对。
它是由 George E. P. Box 与 Mervin E. Muller 在1958年提出,是最早运用与产生高斯白噪声的著名算法之一,它的基本原理是计算出高斯随机数的相位和幅度,进而产生高斯随机数对的算法。实际上,该方法最早是在1934年由Raymond E. A. C. Paley和Norbert Wiener明确提及的。
2024年10月04日
决策树(Decision Tree)是一种常见的机器学习算法,被广泛应用于分类和回归任务中。并且再其之上的随机森林和提升树等算法一直是表格领域的最佳模型,所以本文将介绍理解其数学概念,并在Python中动手实现,这可以作为了解这类算法的基础知识。
在深入研究代码之前,我们先要了解支撑决策树的数学概念:熵和信息增益
熵作为度量来量化数据集中的杂质或无序。特别是对于决策树,熵有助于衡量与一组标签相关的不确定性。数学上,数据集S的熵用以下公式计算:
2024年10月04日
在去年的文章中我们介绍过Bayesian Bootstrap,今天我们来说说Weighted Bayesian Bootstrap
贝叶斯自举法(Bayesian bootstrap)是一种统计学方法,用于在缺乏先验知识的情况下对一个参数的分布进行估计。这种方法是基于贝叶斯统计学的思想,它使用贝叶斯公式来计算参数的后验分布。
在传统的非参数自举方法中,样本是从一个已知分布中抽取的,然后使用这些样本来估计这个分布的性质。然而,在实际问题中,我们通常无法获得这样的先验知识,因此需要使用其他方法来估计分布。