728x90

전체 글 92

[프로그래머스] level1 체육복 - 파이썬(Python) 풀이

문제 프로그래머스-체육복 코드 def solution(n, lost, reserve): answer = 0 lost_1 = lost lost = list(set(lost) - set(reserve)) reserve = list(set(reserve) - set(lost_1)) for i in range(len(reserve)): if(reserve[i]-1 in lost): del lost[lost.index(reserve[i]-1)] elif(reserve[i]+1 in lost): del lost[lost.index(reserve[i]+1)] answer = n-len(lost) return answer 코드풀이 n : 총 학생 수lost : 체육복을 잃어버린 사람의 배열reserve : 여벌의 체육..

코딩코딩 2020.09.25

[Python] 상관 분석(산점도, 상관계수) with Python

이전 게시물에 이어서 이번에는 상관 분석을 파이썬을 통해 알아보자. 귀무가설 : 꽃잎의 길이와 꽃받침의 길이 간에는 관련성(직선의 관계)이 없다.대립가설 : 꽃잎의 길이와 꽃받침의 길이 간에는 관련성(직선의 관계)이 있다. 1. Pearson stats.pearsonr(x = iris.petal_length, y = iris.sepal_length)---------------------------------------------------------------(0.8717537758865832, 1.0386674194497525e-47) Person 방법은 stats.pearsonr() 을 사용한다. 0.872 : 표본의 상관계수(r)0.000 : 유의확률 유의확률이 0.000 이므로 유의수준 0.05에..

[Python] 상관 분석(산점도, 상관계수) - Pearson, Spearman, Kendall

상관분석(Correlation Analysis) 상관분석은 쉽게 말하면 직선(선형)의 관계가 있는지 분석하는 것이다.상관분석에서 알아야 할 점은 [산점도], [상관계수] 이다. 상관 분석의 핵심은 Y를 예측하는 것이고 X 들에 대해 얼마나 선형 관계가 강하고 약한지 파악한다. (featuring) 예를 들어 X_1의 자료가 질적자료이고 A와 B가 있을 때는 Two sample test를 진행하여 Y와의 관계를 파악해 볼 수 있고, A,B,C,D, 등의 질적자료가 있을 때는 분산분석(ANOVA)를 이용할 수도 있을 것이다. X와 Y라는 양적자료가 있을 때 대부분 더 중요한 양적 자료를 Y로 둔다. 분산분석에는 "일원배치 분산분석" 이라는 것이 있다. 질적인 자료 하나를 가지고 양적인 자료와 차이가 있는지 ..

캘리포니아 주택 가격 예측 모델 만들기 - (2) feat.특성 스케일링

이제 데이터를 만져봐야한다. 첫 번째 : total_bedrooms 에만 특성이 없는 경우들이 있었다. (total_bedrooms 만 20433 이다) housing.info() ----------------------------------------- RangeIndex: 20640 entries, 0 to 20639 Data columns (total 10 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 longitude 20640 non-null float64 1 latitude 20640 non-null float64 2 housing_median_age 20640 non-null float64 3 total_r..

개인 프로젝트 2020.09.17

[프로그래머스] level2 - 프린터 : 파이썬(Python) 풀이

문제 프린터 코딩테스트 연습 - 프린터 일반적인 프린터는 인쇄 요청이 들어온 순서대로 인쇄합니다. 그렇기 때문에 중요한 문서가 나중에 인쇄될 수 있습니다. 이런 문제를 보완하기 위해 중요도가 높은 문서를 먼저 인쇄하는 프린�� programmers.co.kr 코드 from collections import deque def solution(priorities, location): cnt = 0 priorities = deque(priorities) prioritie1 = deque([0]*len(priorities)) prioritie1[location] = 1 while(1): if(len(priorities) == 1): cnt += 1 break else: num = priorities.poplef..

코딩코딩 2020.09.16

캘리포니아 주택 가격 예측 모델 만들기 - (1)

# 목적 캘리포니아 인구조사 데이터를 사용해 캘리포니아 주택 가격 모델 만들기. 학습시킨 모델에 다른 측정 데이터가 주어졌을 때 구역의 중간 주택 가격을 예측해야 함. # 파라미터 설명 total_rooms: 전체 방의 개수 total_bedrooms : 전체 침실 개수 population : 인구 수 households : 세대 수 median_income : 중간 소득 median_house_value : 중간 주택 가격 ocean_proximity : 바다 근접도 longitude : 경도 latitude : 위도 housing_median_age : 주택 지어진 기간(중앙값) 1단계 : 문제 정의 이번 작업은 "지도 학습" or "비지도 학습" or "강화 학습" or etc... 중에 무엇일지 ..

개인 프로젝트 2020.09.15

Step2. 머신러닝을 시작하기 전에

머신러닝을 시작하기 전에 알아야 할 것은 특성 공학(feature engineering) 이다. 특성 공학이란 머신러닝 프로젝트에서 훈련에 사용할 좋은 데이터(특성)들을 찾는 것이다. 에러, 이상치, 잡음으로 가득하면 결과가 좋지 않게 나오는 것은 당연하기 때문에 특성 공학에 시간을 쏟는 것은 절대 시간을 버리는 것이 아니다. 특성공학에는 두 가지 작업을 포함한다. 특성 선택(feature selection) : 가지고 있는 특성 중에서 훈련에 가장 유용한 특성을 선택 특성 추출(feature extraction) : 특성을 결합하여 더 유용한 특성을 만든다. 모델이 새로운 샘플에 얼마나 잘 일반화될지 아는 유일한 방법은 새로운 샘플을 실제로 적용해보는 것이다. 그렇게 하기 위해 주로 쓰는 방법은 훈련 ..

[프로그래머스] level2 카펫 - 파이썬(Python) 풀이

문제 코딩테스트 연습 - 카펫 Leo는 카펫을 사러 갔다가 아래 그림과 같이 중앙에는 노란색으로 칠해져 있고 테두리 1줄은 갈색으로 칠해져 있는 격자 모양 카펫을 봤습니다. Leo는 집으로 돌아와서 아까 본 카펫의 노란색과 �� programmers.co.kr 코드 # 2,3,8,9,10 실패 answer = [] for i in range(1, yellow+1): if 2 * (int(yellow / i) + 2) + (i * 2) == brown: answer = [int(yellow/i+2) ,i+2] break answer def solution(brown, yellow): answer = [] for i in range(1, yellow+1): if yellow / i == int(yellow ..

코딩코딩 2020.09.13

Step1. 머신러닝이란.

# 머신러닝 데이터를 기반으로 학습하는 컴퓨터 프로그래밍. 머신러닝 기술을 통해 대용량의 데이터를 분석할 때 겉으로 보이지 않았던 패턴을 발견하게 되는데 그것을 데이터 마이닝(data mining) 이라고 한다. # 머신러닝의 종류 사람이 관여하여 훈련(학습)하는 것의 여부 (지도학습, 비지도학습, 준지도학습, 강화 학습) 실시간으로 학습의 능력을 키워나가는지의 여부(온라인학습, 배치 학습) 알고 있는 데이터와 새로운 데이터를 비교하는지, 훈련 데이터 셋에서 패턴을 발견하여 예측하는지의 여부(사례 기반 학습, 모델 기반 학습) (1) 지도학습 알고리즘 k-NN 알고리즘 선형 회귀(Linear Regression) 로지스틱 회귀(Logistic Regression) 서포트 벡터 머신(SVM; Support..

[독서노트] 모순 - 양귀자(장편소설)

나의 인생에 있어 '나'는 당연히 행복해야 할 존재였다. 이 책은 "활달하고 발랄하며 문득 쓸쓸한 양귀자만의 문장으로 삶과 사랑의 본질을 보여주는 인생학 교과서" 라고 설명한다. 이 책을 다 읽고 든 느낌은 "안진진" 이라는 한 사람의 이야기를 카페에 앉아 실감나게 들었다는 것이었다. 사실 전체적인 내용은 긍정적인 내용이 아니라 행복하게 읽거나, 아 재미있었다 라는 느낌은 들지 않았다. 그저 문학작품을 읽었다는 생각 뿐. 인생은 그냥 받아들이는 것이 아니라 전 생애를 걸고라도 탐구하면서 살아야 하는 무엇이다. 이 책은 "안진진" 이라고 하는 주인공의 시점으로 이야기가 진행된다. 주인공은 뭐랄까 안쓰러운 듯한 인생을 사는 것 같으면서 좋은 인상을 주지 않는 등장인물이라고 느껴진다. 남자에 관해서 나영규와 ..

독서노트 2020.09.13