less than 1 minute read

Summary(Hittrs)


image

AtBat, Hits, HmRun

중간 값이 있고, 평균이 있다. 연속형 변수

Min:1 -  최소값
1st.Qu.:50 - 1사분위수
Median:100 - 중간 
Mean:100 - 평균
3rd Qu.:150 - 3사분위수
Max:200 - 최대값
———1st.Qu.:50 25%———————Median:100 50%———————3rd Qu.:150 75%——

NewLeague

범주형 A와 N 이라는 목록이 있고 해당 하는 범주들이 나오게 된다. A + N = 총 데이터 개수

A: 10
N: 20

Salary

연속형 변수 + 결측치 결측치는 $Na’s$ 로 표시

Min
1st Qu.
median
Mean
3rd Qu
Max.
Na's -> 결측치 (값을 포함하고 있지 않은 )

Summary(orange) - 범주형

image

Tree

나무 사진 상 범주는 7 x 5 = 35 (35개의 데이터 있다.) 즉, tree가 5가지 종류이며 7개씩 있다. Factor 타입이며 순서가 3>1>5>2>4로 되어있다.

age

나이 age의 평균 922

circumference

둘레 약 50% 의 나무가 115보다 큰 둘레를 가지고 있음 median의 수치가 115이므로 약 50%의 나무가 115 보다 큰 둘레를 가지고 있다고 할 수 있다.

summary(Wage)

image

year, age → 연속형

maritl~education → 범주형

maritl , race → 명목형

education → 서열형 (순서를 정할 수 있는 것 )

age

나이 age의 평균 922

circumference

둘레 약 50% 의 나무가 115보다 큰 둘레를 가지고 있음 median의 수치가 115이므로 약 50%의 나무가 115 보다 큰 둘레를 가지고 있다고 할 수 있다.

Tags:

Categories:

Updated:

Leave a comment