티스토리 뷰

 

 

 

 

아래의 코드는

엑셀 파일을 읽어온 다음 

독립 변수와 종속 변수를 지정하고

랜덤 포레스트를 이용하여 

학습시키고 결과를 예측하여 정답률을 출력하는 코드입니다.

 

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

from sklearn.cross_validation import train_test_split

from sklearn.ensemble import RandomForestClassifier

from sklearn import metrics

import pandas as pd

 

# 엑셀 읽어오기

data = pd.read_excel('엑셀이름.xlsx', sheet_name='Sheet1')

 

# 1개 이상의 x값 설정

dfx = pd.DataFrame(data, columns=["AVG_HUMID""TOT_SOLAR"])

 

#비교할 y 값 설정

 

dfy = pd.DataFrame(data, columns=["V_PRICE"])

 

# 학습 전용과 테스트 전용 데이터로 나누기

data_train, data_test, label_train, label_test = train_test_split(dfx, dfy)

 

# 랜덤 포레스트

# 데이터 학습시키기

clf = RandomForestClassifier(criterion='entropy', random_state=0)

clf.fit(data_train, label_train.values.ravel())

 

# 데이터 예측하기

predict = clf.predict(data_test)

 

# 결과 테스트하기

ac_score = metrics.accuracy_score(label_test, predict)

cl_report = metrics.classification_report(label_test, predict)

print("정답률 =", ac_score)

print("리포트 =\n", cl_report)

 

 

 

 

Colored by Color Scripter

cs

 

 

 

 

 

 

 

 

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함