기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II

비트 연산자(Bitwise operators)

컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다.

  1. 2진수로 변환
  2. 동일한 위치에 저장된 값들 사이에 비트단위로 연산

예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다.

표 1 2와 10의 비트 연산
십진수 이진수
2 0 0 1 0
10 1 0 1 0
(+)12 1 1 0 0

비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법을 적용합니다.

표 2 비트 연산자
연산자 의미
x & y 비트 단위로 AND
x | y 비트 단위로 OR
~x 비트 단위로 NOT, 1의 보수(complement)
x^y 비트 단위로 XOR
(다른 값: True(1), 같은 값: False(0))
x >> a 객체 x를 오른쪽으로 a 비트 이동
x << a 객체 x를 왼쪽으로 a 비트 이동

표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에서 연산이 이루어집니다.

x=2
y=10
print(bin(x))
0b10
print(bin(y))
0b1010
x & y
2
x | y
10
x^y
8

위 두 연산의 과정은 다음과 같습니다.

x =  0(F)0(F)1(T)0(F) ⇒ 2
y =  1(T)0(F)1(T)0(F) ⇒ 10
& :  0010 ⇒ 2
| =  1010 ⇒ 10
x^y =  1000 ⇒ 8

연산자 ~는 각 비트 값의 반전입니다. 위 x의 반전(1의 보수)는 다음과 같습니다.

0010
not x(~x) ⇒ 1101

위 반전된 값은 최왼쪽 비트가 1이므로 음수를 나타냅니다. 그러므로 대응하는 십진수를 확인하기 위해서는 양수로 전환합니다. 양수와 음수의 상호전환은 2의 보수에 의해 결정합니다.

1101
2의보수 ⇒ 0011 ⇒ 3
∴ 1101(2) = -3(10)
~x
-3
bin(~0b10)
'-0b11'

비트의 수를 왼쪽, 오른쪽으로 이동하여 수의 변화를 일으킬수 있습니다. 다음은 오른쪽과 왼쪽으로 각 1비트와 2비트를 이동시킨 과정입니다.

x ⇒ 0010
오른쪽 1비트이동: >>1 ⇒ 0001 ⇒ 1
왼쪽 2비트이동: <<2 ⇒ 1000 ⇒ 8
x>>1
1
x<<2
8

특수한 연산자

재할당연산자

위에서 소개한 다양한 연산의 결과를 피연산자 객체에 다시 할당하기 위해 사용합니다(표 3).

표 3 재할당연산자
연산자 x = 5 x += 5 x -= 5 x *= 5 x /= 5
의미 x = 5 x = x+5 x = x-5 x = x*5 x = x/5
연산자 x %= 5 x //= 5 x **= 5 x &= 5 x |= 5
의미 x = x%5 x = x//5 x = x**5 x = x & 5 x = x | 5
연산자 x ^= 5 x >>= 5 x <<= 5
의미 x = x^5 x = x>>5 x = x<<5
x=5
x+=5
x
10
x//=5
x
2
x|=5
x
7
x = 0010
5 = 0101
| ⇒ 0111 = 7

다중할당

파이썬에서는 여러가지 객체에 값들을 동시에 할당할 수 있습니다.

a, b, c=1, 2, 3
(a, b, c)
(1, 2, 3)
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

위코드의 다중할당은 다음과 같이 순차적으로 실행할 수 있습니다.

a, b, c=1, 2, 3
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

in, is 연산자

객체들의 참조위치의 동일성 여부를 확인하기 위해 연산자 is를 적용할 수 있습니다. 또한 여러 요소들로 구성된 객체의 경우 각 요소와 객체의 소유 관계를 나타내기 위해 연산자 in을 사용합니다. 표 4는 이 두 연산자에 대해 소개하고 있습니다.

표 4 in, is 연산자
연산자 의미
x is not y x,y가 동일하면 False
x is y x,y가 동일하면 True
x in y x가 y의 원소이면 True
x not in y x가 y의 원소가 아니면 True
x='python'
y='python practice'
x is y
False
x is not y
True
x=[1,2, 'apple', 7]
 'apple' in x
True
10 in x
False
7 not in x
False

가변연산자('*')

객체의 참조는 일대일로 이루어집니다. 다음 코드는 다중할당을 실행하는 것으로 객체 a, b는 순차적으로 각 값 1과 2를 참조합니다. 나머지 두 개 3과 4를 할당받는 객체 두 개가 필요하지만 연산자 asterik(*)과 연결된 객체 c는 이 두 값을 모두 참조할 수 있습니다. 이 연산자를 가변연산자, 그 대상을 가변객체라고 합니다.

a, b, *c=1,2,3,4
print(a)
print(b)
print(c)
1
2
[3, 4]

위 코드에서 *c는 a와 b에 할당받고 남은 요소들을 모두 할당받습니다. 위와 반대로 할당되는 값이 부족한 경우 객체 가변 객체인 c에는 할당될 데이터가 없는 상태이므로 빈 객체가 생성됩니다. 다시 말하면 가변객체가 참조할 수 있는 객체의 크기는 코드의 실행 중에 결정되므로 일대일로 참조하는 객체들의 실행이 완료된 다음에 가변객체가 할당이 이루어 집니다.

a, b, *c=1,2
print(a)
print(b)
print(c)
1
2
[]

위와 같은 상황으로 가변 객체를 c에서 b로 변경하면 가변객체인 b의 실행은 a, c의 할당이 이루어진 후에 실행됩니다. 그러나 b에 할당할 값이 없는 상태이므로 빈 객체가 됩니다.

a, *b, c=1,2
print(a)
print(b)
print(c)
1
[]
2
a, *b, c=1,2,3,4
print(a)
print(b)
print(c)
1
[2,3]
4

위 코드 결과와 같이 연산자 *와 연결된 객체의 크기는 가변적입니다. 위 결과들로부터 할당하기 위한 값의 수가 객체의 수보다 많을 경우 할당 순서가 지켜집니다. 그러나 값의 수가 작을 경우 가변객체에 할당은 이루어지지 않습니다. 이 순서의 혼동 때문에 일반적으로 가변객체는 순서상 마지막에 입력됩니다.

댓글

이 블로그의 인기 게시물

[python] 컴퓨터에서 숫자를 다루는 방식

컴퓨터에서 숫자를 다루는 방식 정수의 표현방식 부동소수점(float), 실수의 표현 숫자형의 표현범위 사용자가 입력한 값은 컴퓨터 저장 장치에 비트(bit) 단위로 1 또는 0으로 저장됩니다. 결과적으로 컴퓨터 연산은 2진수로 이루어집니다. 정수의 표현방식 다음 식은 컴퓨터에서 5를 저장하거나 연산하기 위해 이진수로 변환한 것입니다. 5 = 1 × 2 2 + 0 × 2 1 + 1 × 2 0 위와 같이 십진수 5는 이진수 101로 변환되며 그 이진수 값은 다음과 같이 아래첨자로 진수를 표현합니다. 일반적으로 십진수에 대한 아래첨자는 생략됩니다. 5 (10) = 101 (2) 1 비트로 표현할 수 있는 수는 0 또는 1이므로 비트수에 대한 표현 용량은 다음과 같이 계산됩니다. c = 2 n ,  c: Capacity, n: 비트수 그러므로 8비트에서의 표현할 수 있는 수는 다음과 같이 256이므로 0 ~ 255까지 나타낼 수 있습니다. 2**8 256 정수인 경우는 음과 양의 사인(sign)을 저장하기 위해 최왼쪽의 1비트가 예약되므로 숫자는 최대 7비트를 사용할 수 있습니다. 양수를 0 음수를 1로 처리합니다. 그러므로 수를 저장하기 위한 비트는 7개로 양수의 최대값은 0111111 (2) 이 됩니다. 이는 127 (10) 이 됩니다. 컴퓨터에서 음수를 직접적으로 표현할 수 없기 때문에 부호 비트를 지정하여 양수에 대한 음수는 2의 보수(tow's complement) 를 사용하여 나타낼 수 있습니다. 일정한 비트수를 기준으로 이진수로 변환할 수 있는 십진수의 범위는 다음과 같이 계산할 수 있습니다. -2 n-1 ~ 2 n-1 - 1, n: 비트수 십진수 정수를 2진수로 전환하기 위해 내장함수 int() , bin() 을 적용합니다. int('0b01111111', 2) 127 int('0b10000000', 2) 1...

[python] 모듈(Module), 패키지(Package)

모듈(Module), 패키지(Package) 프로그램 중 실행가능한 일정한 부분을 그룹화할 수 있습니다. 즉, 그 부분에 이름을 부여하여 객체로 만들어 동일한 작업이 필요할 경우마다 그 객체를 참조하여 사용할 수 있습니다. 그러므로 그 분리된 객체 자체가 프로그램이 되며 모듈(Module) 이라고 합니다. 동일한 자료형을 사용하는 여러개의 모듈을 하나의 디렉터리내로 묶을 필요가 있습니다. 이것을 패키지(package) 라고 합니다. 파이썬에서 사용할 수 있는 다양한 패키지의 존재하며 계속 생성되고 업데이트되고 있습니다. 이와 같이 큰 프로그램을 모듈화하여 사용하는 것은 프로그램의 실행과 수정, 복구 등 다양한 측면에서 유리합니다. 모듈(Module) 객체 정의(definition)와 문(statement)을 포함하는 파일 파이썬에서 생성하는 모듈의 확장명은 .py입니다. 프로그램을 실행 가능한 부분들의 조합으로 작성하기 위해 사용 모듈 전체 또는 일부를 다른 모듈, 프로그램 또는 인터프리터에서 호출하여 사용할 수 있습니다. 예를 들어 객체를 작성하여 확장자 " .py " 형식으로 별도의 파일에 저장한다면 모듈이 됩니다. 모듈/패키지의 import " 임포트(import) "는 파이썬을 작성하고 실행하는 코드 해석기(interpreter)에 모듈을 장착하는 명령 키워드입니다. 다음은 두 수를 더하는 사용자 정의 함수로 별도의 파일(test.py)에 저장된 것입니다. 이 함수는 파이썬 인터프리터의 모든 영역에서 사용할 수 있습니다. 그러나 파이썬 자체를 종결한 후 생성한 함수도 소멸되므로 추후에 사용하기 위해 별도의 파일로 저장합니다. 이렇게 저장된 파이썬 파일이 모듈이 됩니다. def add(a, b): return a+b 위 파일을 모듈로 사용하기 위해 실행파일에서 test.py를 임포트 합니다. 임포트 된 모듈의 함수를 사용하는 경우 식 1과 같이 그 함수의 모듈...