factor分类与显示 R语言
我们对数据进行分类统计时便要用到 factor 数据。一般 factor 类型的数据在数据库中都会以整数存储以节省数据库空间,这样就需要解决 factor 的分类和显示问题。假设有一个公司部门的数据 x,1代表行政部,2代表财务部,3代表销售部,我们如果只要对1和2做分类统计的话,可以使用以下方法。
new_x <- factor(x, levels=c(1, 2))
对于这样的操作,所有原来是3的数据都会被处理为 NA。假设我们还想把1和2显示成字符串。
new_x <- factor(x, levels=c(1, 2), labels=c("行政部", "财务部"))
labels 这个参数根据 levels 中的排序,依次将整数替换成字符串,方便显示。