盐池里的萝卜的日记 标签: R语言

假设我们有个数据长这样的: n = 100 g = 6 set.seed(g) d <- data.frame(x = unlist(lapply(1:g, function(i) rnorm(n/g, runif(1)*i^2))), y = unlist(lapply(1:g, function(i) rnorm(n/g, runif(1)*i^2)))) plot(d) 1. 寻找SSE的拐点 mydata <- d wss <- (nrow(myda...    (3回应)
一、baseball案例 library(plyr) library(ggplot2) head(baseball,5) #求某一选手职业生涯时间 baberuth<-subset(baseball, id == "ruthba01") baberuth<-transform(baberuth, cyear= year -min(year) + 1) #添加一列#求所有选手的职业生涯时间 baseball ...    (1回应)
一、用途 把一个大问题拆分(split)成可以操作的小问题,独立地对每个小问题进行处理(apply),再把所有的小问题处理后的结果再组合起来(combine) 二、优缺点 优点: 1. 替代很多问题中复杂的循环(loops) 2. 从数据结构中的细节脱离出来 3. 可以减少...    (1回应)
数据挖掘,更多的需要花70%以上的时间在数据处理上,所以一些好用的数据处理包会提供很大的方便,也是之前在edx上学Statistic and R for the life Sciences 这门课时候,老师推荐的,感觉很好用的,整理了这个很实用的包的资料。 一、安装 install.package...    (4回应)
一、层次聚类法 层次聚类法。先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离法...    (3回应)

R语言:保存图片方法

2015-07-16 16:28:53
在服务器上运行R程序,没有图形界面,去查看生成的图片,所以查找了如何保存图。 具体代码如下: setwd("c://") jpeg(file="myplot.jpeg") plot(1:10) rect(1, 5, 3, 7, col="white") dev.off() 命令行下运行成功。同时查到另外的几种格式生成函数 第一种p...
Shiny包是个很好玩的包,特点在于不需要了解网页语言,可以用纯R来搭建。生成的网页应用是动态交互,而且是即时更新的。Shiny还提供了现成组件方便快速在网页上展示数据、图表和模型,的确是非常的炫。例子是用ggplot2包来绘制iris数据集的散点图,并将图...
层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由美国运筹学家托马斯·塞蒂(T.L.Saaty)正式提出。它是一种定性和定量相结合的、系统化、层次化的分析方法。由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范围得...
多个数据以不同的日期作文件夹分别存放,每个文件夹中又有近一千个文本文件,每个文件都是一个用户的行为日志。为了分析这些数据,首先需要将这两万个文本文件读入R中,再用字符串函数进行处理成结构化的数据。处理方法如下: library(stringr) setwd('D:\...    (3回应)
一、数据验证代码:将数据分成Training和Testing 1.关键函数 (1)评估框架 evaluationScheme(MovieLense, method = "split",train = 0.9, k = 1,given = 10, goodRating = 4) evaluationScheme()的主要参数: method,评估方法(默认值split) train,...
<前页 1 2 3 4 后页>