반응형

컴퓨터 122

파이썬(Python) - 정규표현식과 메타문자

1. 정규표현식(Regular Expression) 문자의 패턴을 찾을때 많이 사용 문자열에서 특정한 패턴과 일치하는 문자열을 검색하거나 치환, 제거하는 기능을 제공한다. 2. 메타문자 a.b .위치에 모든 문자 a[.] .를 문자로 인식해서 찾을때 a*b *앞 문자를 0번, 1번, 몇번 이상 a+b +앞 문자를 최소 1번 이상 반복 a{2}b {n}앞 문자를 n번 반복 a{2,3}b {n,m}앞 문자를 n번 또는 m번 반복 ab?c ?앞 문자를 0번, 1번 반복 a|b a 또는 b [a-zA-Z] 알파벳 모두 찾기 [0-9] 숫자 모두 찾기 \d 숫자 모두 찾기 \D 숫자가 아닌것과 매치 (= [^0-9]) \s 공백 문자 모두 찾기 \S 공백문자가 아닌것과 매치 \w 문자, 숫자 (= [a-zA-Z0..

컴퓨터/파이썬 2020.03.24

파이썬(Python) - matplotlib ③ 상자 그림 / 줄기잎 그림

1. 상자그림 (box plot) 5가지의 요약 수치 값으로 표현된다. 최소값(0), 제1사분위수(25), 중위수(50), 제3사분위수(75), 최대값(100) 사분위값 : np.percentile(객체,[0,25,50,75,100]) 1) 중앙값 : 관측값을 크기순으로 정렬한 후 가운데 위치하는 값 관측값이 홀수일때 중앙값 # 차례로 정렬 했을때 중간번째 있는 값 weight = Series([35,40,45,50,55,60,65]) statistics.median(weight) # 내부에서 이런 식이 돌아가고 있다. weight = Series([35,40,45,50,55,60,65]) weight = weight.sort_values() weight = weight.reset_index(drop=T..

컴퓨터/파이썬 2020.03.24

파이썬(Python) - matplotlib ② histogram

histogram 자료가 모여 있는 위치나 자료의 분포에 관한 대략적인 정보를 한눈에 파악할 수 있는 장점은 있으나 구체적인 수치정보를 쉽게 알아볼수없는 단점이 있다. 예) ages=[21,24,26,27,29,31,37,39,40,42,45,50,51,59,60,68] 1. List 형식 # 키에 관한 데이터 (이산형 데이터) height = [157,163,180,162,186,178,173,152,156,184,170,171,172] type(height) 1) 도수분포표로 만들기 # 분할 구간 만들기 (150~160, 160~170, 170~180, 180~190) bins = [150,160,170,180,190] # pd.cut(객체, 구간, 구간 기준) # 구간 기준 기본값은 True blo..

컴퓨터/파이썬 2020.03.23

파이썬(Python) - matplotlib ① pie chart / bar chart / line plot

1. 자료의 시각화 1) 자료 어떠한 가치 판단을 할 수 있는 근거가 되는 재료 문제해결을 위한 원재료로 처리되진 않은 숫자, 문자, 일련의 사실이나 기록들의 모임 2) 양적자료 (Qunatitative Data, 수치형 자료) 수치로 측정이 가능한 자료 테이블 생성할때 숫자로 되어있는거 양적자료이다. 연속형 자료(continuous data) : 실수형 예) commission_pct, 키, 몸무게 이산형 자료(discrete data) 정수형 예) 출생아수, 남학생수, 왼손잡이수 3) 질적자료(Qualitaive Data, 범주형 자료) 수치 측정이 불가능한 자료 자료의 내포하는 의미가 있는 자료 순위형 자료 (ordinal data) : 학점(A+,B,..), 매우좋아, 보통, 아주나쁘다 명목형 자..

컴퓨터/파이썬 2020.03.22

파이썬(Python) - 파이썬에서 오라클 SQL로 접속하는 방법

1. Anaconda Prompt창을 관리자 권한으로 실행한다. 2. cx_Oracle 라이브러리를 설치한다. 혹시 라이브러리가 기존에 설치되어 있다면 업그레이드한다. python -m pip install cx_Oracle --upgrade 3. 파이썬 IDE를 실행시키고 cx_Oracle를 임포트한다. import cx_Oracle 4. 접속해야할 DB서버의 아이피 주소 혹은 서버이름, 포트번호, SID 정보를 입력한다. dsn = cx_Oracle.makedsn("localhost",1521,"xe") dsn 5. 데이터 베이스의 이름, 비밀번호, dsn으로 데이터 베이스에 연결한다. db = cx_Oracle.connect("hr","1234",dsn) db 6. SQL문 실행 메모리 영역(cur..

컴퓨터/파이썬 2020.03.19

오라클 SQL - Top - N 분석

SQL에서 Top-N분석을 하기 위해서는 rank() over()문을 사용한다. 1.1) rank()는 중복 순위 다음 순위를 건너뛰고 1.2) dense_rank()는 중복 순위 다음 순위를 건너뛰지 않는다. rank() over()에서 over()은 분석함수이며 괄호 안에 2.1) order by를 사용하여 정렬하거나 2.2) partition by를 사용하여 분류별 랭크를 지정할 수 있다. 2.3) 또한 select절의 group함수 뒤에 over()을 붙이면 group by절을 사용하지 않아도 되며 2.4) group함수 뒤에 over(order by)를 붙이면 정렬 및 누적 연산을 구할 수있다. 1. rank와 dense_rank 1.1 select rank() over(order by sala..

컴퓨터/SQL 2020.03.19

SQL문 처리 단계

1. parse 문법(syntax)검사 -> 의미(semantic)검사 -> 권한 검사 -> 실행 계획 생성 메모리에 실행 계획 만든다. 실행계획 : 데이터를 어떻게 찾아오는게 가장 좋은지(데이터 엑세스방법 : rowidscan / fulltablescan) 2. bind 변수에 실제값이 들어가는 단계 SQL 문장의 변수처리 : select * from employees where employee_id = :v_id; 변수처리하는 이유는 실행계획을 sharing하기 위해서이다. sql문장의 실행계획을 sharing하려면 대소문자, 공백문자, tap키, enter키, 주석문자, 힌트, 상수값, 리터럴값이 다 맞아야한다. 실행계획 sharing 못하면 실행계획을 만들어야한다. -> CPU 사용량과 디스크 I..

컴퓨터/SQL 2020.03.18

파이썬(Python) - Sqlite 사용법

sqlite 별도의 DB서버가 필요없이 DB파일 기초하여 데이터베이스 처리하는 엔진 # sqlite3 라이브러리를 임포트 import sqlite3 1. 기본 사용법 # 메모리에다가 DB서버를 구성(연결)하기 conn = sqlite3.connect(":memory:") # sql문 작성하고 실행할 수 있는 메모리 영역 만들기 c = conn.cursor() # 테이블 생성 및 데이터 타입 지정하기 / integer = 숫자타입 c.execute("create table dessert(id integer, name char, kal integer)") # 테이블안에 값 넣기 c.execute("insert into dessert(id,name,kal) values(1,'케이크',324)") # 메모리에 ..

컴퓨터/파이썬 2020.03.17

파이썬(Python) - 날짜 계산

1. 날짜와 날짜 계산 # 현재 시간 - 지정한 시간의 일수 계산 (datetime.datetime.now() - datetime.datetime(2019, 7, 13, 10, 10, 10, 100)).days # 현재 시간 + 50일 더하기 datetime.datetime.now() + datetime.timedelta(days = 50) # Timedelta : 일, 시, 분, 초 계산 가능 # 현재 시간 + 1일 더하기 pd.datetime.now() + pd.Timedelta('1 days') # 현재 시간 + 8시간 더하기 pd.datetime.now() + pd.Timedelta('8 hours') # 현재 시간 + 60분 더하기 pd.datetime.now() + pd.Timedelta('6..

컴퓨터/파이썬 2020.03.17

파이썬(Python) - Pandas의 날짜함수

pandas의 날짜함수 import datetime # 현재 날짜, 시간 출력 / datetime.datetime.now() pd.datetime.now() # 현재 날짜 출력 pd.datetime.now().date() # 현재 년도 출력 pd.datetime.now().year # 현재 월 출력 pd.datetime.now().month # 현재 일 출력 pd.datetime.now().day # 현재 시 출력 pd.datetime.now().hour # 현재 분 출력 pd.datetime.now().minute # 현재 초 출력 pd.datetime.now().second # 현재 마이크로초 출력 pd.datetime.now().microsecond timestamp형식으로 출력 pd.Timesta..

컴퓨터/파이썬 2020.03.16
반응형