일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- javascript
- 머신러닝
- request
- lombok
- SOUP
- regressor
- 비전공자
- 정보처리기사
- Req
- dataframe
- Intellij
- pds
- BS
- AWS
- APPEND
- 자바
- pandas
- ensemble
- 크롤링
- java
- springboot
- BeautifulSoup
- 정보처리기사필기
- 웹앱
- 자바스크립트
- 백준
- sklearn
- list
- 정처기
- crawling
- Today
- Total
목록dataframe (6)
No sweet without sweat

1. 문제정의 - iris(붓꽃) 데이터를 활용 - 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 4가지 특징을 통해 3가지 품종을 구분 - KNN모델의 이웃의 숫자를 조절해보자 (Hyperparameter) 2. 데이터수집 - sklearn 에서 제공하는 붓꽃 데이터 사용 1) 먼저 라이브러리 임포트 from sklearn.datasets import load_iris 2) 데이터 불러오기 load_iris()' 3) 변수에 저장 iris_data = load_iris() 4) keys 확인 .keys() 5) values 확인 .values() 6) 데이터 프레임 실제 값 확인하고 문제데이터 보기 iris_data['data'] 7) 문제에 대한 정답 데이터 확인 i..

머신러닝 종류 1. 지도학습(Supervised Learning) : 정답이 있음 1) 데이터에 대한 Label(명시적인 답)이 주어진 상태에서 컴퓨터를 학습시키는 방법 2) 사람이 직접 개입하기 때문에 정확도가 높은 데이터 사용가능 3) 사람이 직접 Label을 달아야 하므로 구할 수 있는 데이터의 한계가 있음 4) 분류(Classification)와 회귀(Regression)으로 나누어진다. - 스팸 메일 분류, 집 가격 예측 *분류 - 미리 정의된 여러 클래스 레이블 중 하나를 예측( 정답의 종류가 정해져 있음) - 속성 값을 입력, 클래스 값을 출력(정답을 예측)하는 모델 - 붓꽃(iris)의 세 품종 주 하나로 분류, 암 분류, 이진분류, 다중 분류 등이 있다. (정답 -> 레이블, 정답의 종류..

plt.scatter(data_merge['소계'], data_merge['인구수']) plt.show() 문제 - 서울시 각 구별 CCTV수 파악 - 인구대비 CCTV 비율을 파악해서 순위매기기 - 인구대비 CCTV의 예측치를 확인하고, CCTV가 부족한 구 확인 1. 사용할 라이브러리 임포트하기 import numpy as np import pandas as pd import matplotlib.pyplot as plt - numpy : 고성능 과학계산을 위한 라이브러리, 다차원 데이터 다루는데 용이 - pandas : 데이터를 표 형식으로 보여줌 1, 2차원 데이터(DataFrame) - matplotlib : 데이터 시각화 2. CSV 파일 읽어오기 1) 서울시 구별 CCTV cctv_..

문제 1. 1) 22 ? 7 = 37 2) 큰수 + 두 수의차 3) 22+(22-7) 먼저 dataframe을 이용할꺼라 pandas 라이브러리를 가져와야 합니다. import pandas as pd 1. 문제와 정답 만들기 1) 문제와 정답을 담을 리스트 만들기 list1=[] 2) 1부터 199까지 동작하는 for문 만들기 (변수a) for a in range(1,200): 3) 1부터 199까지 동작하는 for문 만들기 (변수b) for b in range(1,200): 4) 규칙을 통해 a와 b를 연산한 결과 만들기 (변수result) if a > b: result = a +(a-b) else: result = b +(b-a) 5) 리스트에 문제(a,b)와 정답(result) 담기 list..

- 컴퓨터가 컴퓨터를 제어하자 - Selenium 모듈 : 웹페이지를 제어하기위한 모듈 * 처음 시작 시 셀레니움 설치 필요 : !pip install selenium # webdriver = 웹페이지를 제어하기 위한 모듈 >> 웹 그자체가 됨 # Keys = 컴퓨터의 키보드와 같은 역할 모듈 # time = 쉬는시간을 부여한다. 1) 값 import 해오기 from selenium import webdriver as wb from selenium.webdriver.common.keys imports Keys import time 2) 크롬 드라이버 실행 3) 검색창의 위치를 알아보기 * 똑같이 f12누르고 검색창 검사하면 위치를 확인할 수 있습니다. # id : "query" ..

문제 1. 멜론 TOP 100 가수 수집 1) requests와 beautifulSoup 값 import 해오기 2) 그리고 멜론사이트는 사용자임을 확인 시켜줘야겠죠? 3) 제대로 불러와졌는지 text를 통해 확인하기 4) 우리는 원하는 값만 볼꺼기 때문에 bs에 담아줍시다 5) top 100가수를이제 가져와볼거에요 - 가수에 오른쪽 마우스 버튼 -> 검사 따로 class가 지정되어있지 않아서 그 부모 태그를 보셔야합니다. soup.select("div.ellipsis.rank02 > a") 로 값을 확인하고 singer 변수에 담아줍니다. 5-1) 갯수 확인하기 어라, top100인데 108개가 있네요 어디서 문제가 있는거겠죠? 태그에서 잘못이 있었나보네여 다시 확인해보..