기본 콘텐츠로 건너뛰기

[python] 제너레이터(generator)를 통해 효율적인 코드작성

오늘은 generator에 대해서 알아볼까 합니다

우선 generator는 python말고도 javascript es6에서도 새롭게 추가된 부분이기도 합니다.

우선 python docs의 generator에 대한 정의를 봅시다.
generator

A function which returns an ierator. 
It looks like a normal function except that it comtains yield statements for 
producting a series of values usable in a for-loop that can be retrieved 
one at a time with the next() function. Each yield temporarily suspends processing, 
remembering the location execution state (including local variables and pending 
try-statements). When the generator resumes, it picks-up where it left-off
(in contrast to functions which start fresh on every invocation).
첫 줄에 한 줄로 정의가 됐다. 
반복자를 반환하는 함수
모든 호출에서 새롭게 시작되는 함수가 아닌 위치를 기억하는 함수

즉 특정 위치를 기억하여 루프를 돌릴 수 있도록 반환을 하는 것이다.
해당 함수는 next()를 이용하여 호출이 가능.

간단한 코드를 통해 generator의 사용방법을 알아보자.
# app.py
def generator(n):
    i = 0
    while i < n:
        yield i
        i += 1

_generator = generator(10)

print(_generator)

for i in _generator:
    print(i)

실행결과
$ python3 app.py

1
2
3
4
5
6
7
8
9

얼핏 보면 일반 리스트 루프를 돌리는 것과 별반 다를건 없어 보인다. 

하지만 함수 generator()를 보면 내부에 yeild라는 것을 볼 수 있다. 또한 해당 함수는 generator형 object를 반환을 하게된다.
해당 함수가 호출되어 yeild를 만나게 되면 해당 함수의 yeild지점에서 return과 같이 값을 반환을 하게 되는데 이때 완변한 함수 종료가 아닌 해당 지점의 위치를 기억하여 다음에 호출되는 시점을 저장을 하게 된다.

즉 값을 반환을 하면서 다시 그 지점으로 호출을 할 수있도록 되어있는 구조이다.
(신기하지 않은가?? 이 yeild에 대한 이해를 완벽히 하길 바란다. 필자는 yeild를 무시하고 generator라는 놈을 완벽히 이해하기 까지 상당한 오랜 시간이 걸렸던것 같다. 그렇게 때문에 왜 써야 하는지가 가장 큰 의문이었다. 이유는 아래에 설명을 계속 해보도록 하겠다.)


여기까지 함수에 yeild를 이용하여 generator를 만드는 방법에 대해서 알아보았다.

하지만 python에서는 generator를 좀더 쉽게 사용하는 방법을 제공을 하고 있다.
[], {}는 무엇을 의미하는가??
[]는  list(), {}는 dictionary를 의미한다.

generator도 위와같이 쉽게 쓰는 표현법을 제공을 한다 바로 ()이다.
# app.py
_generator = (1, 2, 3, 4, 5, 6)
그러나 위와같이 작성을 하면 안된다.

사실 python에는 tuple이라는 타입이 있다.

()을 사용하기 위해서는 list comprehension에서 []대신 ()을 사용을 하는 것이다.
# app.py
_list = [i for i in range(10)]
_generator = (i for i in range(10))

print(_list)
print(_generator)
실행결과
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
 at 0x10213d8e0> 
정상적으로 generator object를 반환을 하게 된다.
generator는 일반 iterator와 마찬가지로 for - loop를 똑같이 작동을 시킬 수 있다.
 

여기까지가 generator의 모든 것이다.
그렇다면 의문이 들 것이다.

첫번째 : 왜쓸까? iterator를 돌릴 수 있다면 list를 안쓰고 굳이 generator를 쓰는 이유가 무엇일까?
generator를 쓰는 가장 큰 이유는 memory의 사용성 입니다.
# app.py
import sys

maxed = 10

_list = [i for i in range(maxed)]
_generator = (i for i in range(maxed))

print(sys.getsizeof(_list))
print(sys.getsizeof(_generator))
sys의 getsizeof를 이용하면 해당 변수의 메모리 사용크기를 확인을 할 수있습니다.

위 결과를 확인 해보면 
list인 _list는 192
generator인 _generator는 88만큼의 메모리 공간을 사용할 수 있음을 확인 할 수 있습니다.

만약 maxed값이 커지면 메모리의 크기는 어떻게 될까?
list인 경우는 커진만큼 더 커지고 generator의 경우는 88로 고정이 된다.
generator는 해당 시점의 주소값만 저장을 하고 다른 데이터는 더 저장을 할 필요가 없기때문에 크기가 늘어날 필요가 없다



generator를 사용을 하면 코드를 원하는 시점에서 실행이 가능해지는 장점이 있습니다.

상당히 많은 python 라이브러리들이 generator형태로 값을 만들어 내는데 바로 이 때문이다.

댓글

이 블로그의 인기 게시물

[kali linux] sqlmap - post요청 injection 시도

아래 내용은 직접 테스트 서버를 구축하여 테스트 함을 알립니다.  실 서버에 사용하여 얻는 불이익에는 책임을 지지 않음을 알립니다. sqlmap을 이용하여 get요청이 아닌 post요청에 대해서 injection공격을 시도하자. 뚀한 다양한 플래그를 이용하여 DB 취약점 테스트를 진행을 해보려고 한다. 서버  OS : windows 7 64bit Web server : X Server engine : node.js Framework : expresss Use modules : mysql Address : 172.30.1.30 Open port : 6000번 공격자 OS : kali linux 64bit use tools : sqlmap Address : 172.30.1.57 우선 서버측 부터  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 var  express  =  require( 'express' ); var  app  =  express(); var  mysql  =  require( 'mysql' ); var  ccc  =  mysql.createConnection({     host: '127.0.0.1' ,     user: 'root' ,     pos...

[git] git log 확인하기

git log를 통해서 커밋 이력과 해당 커밋에서 어떤 작업이 있었는지에 대해 조회를 할 수 있다. 우선 git에서의 주요 명령어부터 알아보겠다. $ git push [branch name] $ git pull [branch name] 여기서 branch name은 로컬일 경우 해당 브런치 이름만 적으면 되지만 깃허브 원격 저장소로 연결을 원할 경우는 해당 브런치 이름 앞에 꼭 origin을 붙이도록 한다. $ git brnch [branch name] $ git checkout [branch name] branch일경우 해당 브런치를 생성을 한다. 여기서 현재의 브런치를 기준으로 브런치를 따는것이다. checkout은 브런치를 바꾸는 것이다.(HEAD~[숫자]를 이용하면 해당 커밋으로 움직일수 있다.. 아니면 해당 커밋 번호를 통해 직접 옮기는것도 가능하다.) -> 해당 커밋으로 옮기는 것일뿐 실질적으로 바뀌는 것은 없다. 해당 커밋으로 완전히 되돌리려면 reset이라는 명령어를 써야한다. 처음 checkout을 쓰면 매우 신기하게 느껴진다. 막 폴더가 생겼다가 지워졌다가 ㅋㅋㅋㅋㅋ  master 브런치에서는 ht.html파일이 존재하지만 a브런치에서는 존재하지않는다. checkout 으로 변경을 하면 D 로 명시를 해준다.  $ git log 해당 브런치의 커밋 내역을 보여준다. a 브런치의 커밋 내역들이다. (머지 테스트를 하느라 커밋 내용이 거의 비슷하다 ㅋㅋ) master 브런치의 커밋 내역들이다. 커밋 번호, 사용자, 날짜, 내용순으로 등장을 한다. 이건 단순히 지금까지의 내역을 훑어보기 좋다. 좀더 세밀한 내용을 봐보자. $ git log --stat --stat을 붙이면 기존의 로그에서 간략하게...

[git] pull을 하여 최신코드를 내려받자

보면 먼가 로고가 다르게 뜨는것을 확인을 할 수가있다. C:\Users\mung\Desktop\etc\study\python-gene>git checkout remotes/origin/master Note: checking out 'remotes/origin/master'. You are in 'detached HEAD' state. You can look around, make experimental changes and commit them, and you can discard any commits you make in this state without impacting any branches by performing another checkout. If you want to create a new branch to retain commits you create, you may do so (now or later) by using -b with the checkout command again. Example:   git checkout -b HEAD is now at 29e282a... fetch test C:\Users\mung\Desktop\etc\study\python-gene>git branch * (HEAD detached at origin/master)   master   test1   test2 깃이 잘 쓰면 참 좋은놈인데 어지간히 쓰기가 까다롭다. 처음에 깃을 푸시 성공하는데만 한달정도 걸렸던걸로 기억이 난다.. ㅋㅋㅋ 여담으로  깃 프로필을 가면 아래사진 처럼 보인다. 기여도에 따라서 초록색으로 작은 박스가 채워지는데 저걸 잔디라고 표현을 한다고 합니다 ㅎ 저 사진은 제 깃 기여도 사진입니당 ㅋㅋㅋㅋ 다시 본론으로 돌아와서 ㅋㅋ pull을 하면...