分类数据的属性集 数据挖掘为什么要对数据进行分类

作者&投稿:谏露 (若有异议请与网页底部的电邮联系)

让我们考察这种方法的一个例子。
例2-7 根据每个属性的不同值的个数产生概念分层。假定用户从AllElectronics数据库中选择了关于location的属性集:street, country, province_or_state和city,但没有指出这些属性之间的层次序。
location的概念分层可以自动地产生,如图2-24所示。首先,根据每个属性的不同值个数,将属性按升序排列,其结果如下(其中,每个属性的不同值数目在括号中):country(15), province_or_state(365), city(3567), street(674 339)。其次,按照排好的次序,自顶向下产生分层,第一个属性在最顶层,最后一个属性在最底层。最后,用户考察所产生的分层,必要时,修改它以反映属性之间期望的语义联系。在这个例子中,显然不需要修改所产生的分层。
图2-24 基于不同属性值个数的模式概念分层的自动产生
注意,这种启发式规则并非完美无缺的。例如,数据库中的时间维可能包含20个不同的年,12个不同的月,每星期7个不同的天。然而,这并不意味时间分层应当是“year < month < days_of_the_week”,days_of_the_week在分层结构的最顶层。
只说明部分属性集:在定义分层时,有时用户可能不小心,或者对于分层结构中应当包含什么只有很模糊的想法。结果,用户可能在分层结构说明中只包含了相关属性的一小部分。例如,用户可能没有包含location所有分层相关的属性,而只说明了street和city。为了处理这种部分说明的分层结构,重要的是在数据库模式中嵌入数据语义,使得语义密切相关的属性能够捆在一起。用这种办法,一个属性的说明可能触发整个语义密切相关的属性组“拖进”, 形成一个完整的分层结构。然而必要时,用户应当可以选择忽略这一特性。 例2-8 使用预先定义的语义关系产生概念分层。假定数据挖掘专家(作为管理者)已将五个属性number, street, city, province_or_state和country捆绑在一起,因为它们关于location概念语义密切相关。如果用户在定义location的分层结构时只说明了属性city,系统可以自动地拖进以上五个语义相关的属性,形成一个分层结构。用户可以选择去掉分层结构中的任何属性,如number和street,让city作为该分层结构的最低概念层。



数据库 属性,属性组与属性集的区分~

一个元组的,因为我们可以根据key来,表示数据,也即其属性;
是所有列的集合。

这些是高级数据库管理的内容。

对数据进行分类主要是方便存储和读取,不同类型的数据的大小或者说是存储长度是不一样的,分开后无论是读取还是存储都要方便和快捷很多。没有数据语义的知识,就找不出任意的分类属性集的分层序。


含义分层:定属性集中每个属性不同值的个数自动地产生概念分层。具有最多不同值的属性放在分层结构的最低层。一个属性的不同值个数越少,在所产生的概念分层结构中所处的层次越高。在许多情况下,这种启发式规则都很顶用。在考察了所产生的分层之后,如果必要,局部层次交换或调整可以由用户或专家来做。

分类数据是统计数据的一种。指反映事物类别的数据。如人按性别分为男、女两类。 分类数据是离散数据。分类属性具有有限个(但可能很多)不同值,值之间无序。例子包括地理位置、工作类别和商品类型。有很多方法产生分类数据的概念分层。

分类数据的属性集
答:假定用户从AllElectronics数据库中选择了关于location的属性集:street, country, province_or_state和city,但没有指出这些属性之间的层次序。location的概念分层可以自动地产生,如图2-24所示。首先,根据每个属性的不同值个数,将属性按升序排列,其结果如下(其中,每个属性的不同值数目在括号中):countr...

数据类型的基本属性有哪些?
答:基本数据类型如下:1、整数型:byte、short、int、long。2、浮点型:float、double.3、字符型:char。4、布尔型:boolean。数据类型在数据结构中的定义是一个值的集合以及在这个值集上的一组操作;因为不同的数据类型所占用的空间不一样,也就是为了更好的用计算机的内存空间。基本属性:(1)标识类属...

类的成员有哪些
答:属性(变量):类的属性是描述该类对象的特征或状态的变量。它们定义了在类实例中存在的数据。每个对象都有它们自己的属性集,这些属性的值是特定于该对象的实例的。例如,如果我们有一个“汽车”类,那么属性可能包括颜色、品牌、型号等。这些属性描述了特定汽车实例的特性。方法(函数):类...

数据的属性类型有哪些
答:数据的属性类型有:1、标称属性标称属性的值是一些符号或实物的名称,每个值代表某种类别、编码或状态,所以标称属性又被看做是分类型的属性(categorical)。这些值不必具有有意义的序,并且不是定量的。2、二元属性二元属性是一种标称属性,只有两个类别或状态:0或1,其中0常表示不出现,1表示出现。如...

什么叫量化数据和类别数据
答:从而达到分析比较的目的。类别数据是按照现象的某种属性对其进行分类或分组而得到的反映事物类型的数据,又称定类数据。为了便于计算机处理,通常用数字代码来表述各个类别,比如,用1表示“男性”,0表示“女性”,但是1和0等只是数据的代码,它们之间没有数量上的关系和差异。

类的定义
答:类是面向对象编程的基础,它是对对象的抽象,用于描述具有相同属性和行为的对象的集合。类定义了对象的基本结构,包括属性(成员变量)和方法(成员函数)。类是对象的模板或原型,通过类可以创建具体的对象。类定义原理是将数据(属性)和处理数据的方法结合在一起,形成一个独立的单元,从而实现对数据的...

按动态特性分,数据的属性可分为几类?为什么要进行这种分类?
答:数据按动态特性可分为固定值属性数据、固定个体变动属性数据和随机变动属性数据三类。其中固定值属性数据项的值基本固定不变,如工资系统中的基本工资;对固定个体变动属性数据项来说,其总体具有相对固定的个体集,但其值是变动的属性,例如工资系统中的扣托儿费;对随机变动属性的数据项来说,其个体和值...

按动态特性分的数据属性类别及各类的特点是什么
答:按动态特性分的数据属性类别及各类的特点 1)固定值属性。具有固定值属性的数据,其值基本上固定不变。2)固定个体变动属性。这类数据项,从总体上说具有相对固定的个体集,但其值是变动的属性。3)随机变动属性。这种数据项,其个体是随机出现的,值也是变动的。

什么是数据集属性?
答:简单的说数据集(recordset)属性是指数据集的一些可以通过定义值而实现不同功能,这些值就是数据集属性。返回或设置由 Data 控件的属性或由现有的 Recordset 对象所定义的 Recordset 对象。语法 Set object.Recordset [= value ]]Recordset 属性的语法具有这些部分:对部分 描述 object 对象表达式,其值是...

数据库 属性,属性组与属性集的区分
答:一个元组的,因为我们可以根据key来,表示数据,也即其属性;是所有列的集合。这些是高级数据库管理的内容。