搜索此博客

2017年4月6日星期四

R 连接 redis

library(rredis)
redisConnect(host = '127.0.0.1',port = 6379)
redisKeys()
redisDBSize()

R 连接 Mongodb

library(RMongo)
mongo <- mongoDbConnect("local")
dbShowCollections(mongo)
results <- dbGetQuery(mongo, "startup_log", "{}", 0, 2)
dbDisconnect(mongo)

R 连接 MySQL

library(RMySQL)
library(psych)
conn <- dbConnect(MySQL(),dbname="douban",user="root",password="52332580",host='127.0.0.1')
dbWriteTable(conn, name = 'Test', value = as.data.frame(Thurstone))
dbGetQuery(conn,"select * from Test")
dbDisconnect(conn)

2017年4月1日星期六

判断数据是否服从某一分布

 1、原理
   对于不同的分布,有特定的偏度(skewness)和峰度(kurtosis),正态分布、均匀分布、逻辑斯谛分布、指数分布的偏度和峰度都是特定的值,在偏度-峰度图中是特定的点,而伽马分布和对数正态分布在偏度-峰度图中是一条直线,贝塔分布在偏度-峰度图中是一片区域。因此可以通过未知分布的偏度峰度值(在图中是一个观察点),与各种分布的偏度峰度点(线、区域)进行对比,判断未知分布数据大致可能的一个或几个分布。
2、R语言实现
library(fitdistrplus)
x<-c(0.8,11.7,2.8,11.9,6.1,1,
     34.8,3.8,5.2,15.0,10.3,12.3,
     8.2,0.6,1.7,14.5,8.3,28.9,
     3.1,7.3,10.2,8.9,0.1,15.5,
     5.7,0.7,8.3,0.9,40.7,2.9)
descdist(x)



#观察点接近的分布有gamma分布和指数分布
#fitdist对特定分布的服从程度
fitdist(x, "gamma")
fitdist(x, "exp")

Std.Error(标准误)更小。所以数据更服从指数分布。