iris 붓꽃 데이터는 머신러닝용으로 아주 유명한 데이터이다. R을 배우건 Python을 배우건 무조건 경험 하는 것인데, 처음에 보면 데이터가 매우 생소하다 . 간단하게 설명 하면 꽃받침및 꽃잎의 길이, 넒이 가지고 꽃의 종을 결정 하는 데이터 이다. 데이터 표현에 있어서, 매우 용이한 데이터 셋이다.
분류 산점도는 seaborn의 lmplot() 함수를 이용한다. 이것에 대한 문법에 있어서, 약간 특이 사항이 있다면, hue(색조)라는 것인데, 꽃의 종(데이터 그룹)을 분류하는 매계변수가 된다.
x : x 점의 위치
y: y 점의 위치
data : 데이터 세트
fit_reg : True인 경우 선형 회귀 적합 선 표시
hue : 데이터의 하위 집합을 정의하는 변수
legend : True인 경우 범례 추가
# Use the 'hue' argument to provide a factor variable
sns.lmplot( x="sepal_length", y="sepal_width", data=df1, fit_reg=False, hue='species',
legend=False)
# Move the legend to an empty part of the plot
plt.legend(loc='lower right')
plt.show()
댓글 없음:
댓글 쓰기