기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II

비트 연산자(Bitwise operators)

컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다.

  1. 2진수로 변환
  2. 동일한 위치에 저장된 값들 사이에 비트단위로 연산

예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다.

표 1 2와 10의 비트 연산
십진수 이진수
2 0 0 1 0
10 1 0 1 0
(+)12 1 1 0 0

비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법을 적용합니다.

표 2 비트 연산자
연산자 의미
x & y 비트 단위로 AND
x | y 비트 단위로 OR
~x 비트 단위로 NOT, 1의 보수(complement)
x^y 비트 단위로 XOR
(다른 값: True(1), 같은 값: False(0))
x >> a 객체 x를 오른쪽으로 a 비트 이동
x << a 객체 x를 왼쪽으로 a 비트 이동

표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에서 연산이 이루어집니다.

x=2
y=10
print(bin(x))
0b10
print(bin(y))
0b1010
x & y
2
x | y
10
x^y
8

위 두 연산의 과정은 다음과 같습니다.

x =  0(F)0(F)1(T)0(F) ⇒ 2
y =  1(T)0(F)1(T)0(F) ⇒ 10
& :  0010 ⇒ 2
| =  1010 ⇒ 10
x^y =  1000 ⇒ 8

연산자 ~는 각 비트 값의 반전입니다. 위 x의 반전(1의 보수)는 다음과 같습니다.

0010
not x(~x) ⇒ 1101

위 반전된 값은 최왼쪽 비트가 1이므로 음수를 나타냅니다. 그러므로 대응하는 십진수를 확인하기 위해서는 양수로 전환합니다. 양수와 음수의 상호전환은 2의 보수에 의해 결정합니다.

1101
2의보수 ⇒ 0011 ⇒ 3
∴ 1101(2) = -3(10)
~x
-3
bin(~0b10)
'-0b11'

비트의 수를 왼쪽, 오른쪽으로 이동하여 수의 변화를 일으킬수 있습니다. 다음은 오른쪽과 왼쪽으로 각 1비트와 2비트를 이동시킨 과정입니다.

x ⇒ 0010
오른쪽 1비트이동: >>1 ⇒ 0001 ⇒ 1
왼쪽 2비트이동: <<2 ⇒ 1000 ⇒ 8
x>>1
1
x<<2
8

특수한 연산자

재할당연산자

위에서 소개한 다양한 연산의 결과를 피연산자 객체에 다시 할당하기 위해 사용합니다(표 3).

표 3 재할당연산자
연산자 x = 5 x += 5 x -= 5 x *= 5 x /= 5
의미 x = 5 x = x+5 x = x-5 x = x*5 x = x/5
연산자 x %= 5 x //= 5 x **= 5 x &= 5 x |= 5
의미 x = x%5 x = x//5 x = x**5 x = x & 5 x = x | 5
연산자 x ^= 5 x >>= 5 x <<= 5
의미 x = x^5 x = x>>5 x = x<<5
x=5
x+=5
x
10
x//=5
x
2
x|=5
x
7
x = 0010
5 = 0101
| ⇒ 0111 = 7

다중할당

파이썬에서는 여러가지 객체에 값들을 동시에 할당할 수 있습니다.

a, b, c=1, 2, 3
(a, b, c)
(1, 2, 3)
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

위코드의 다중할당은 다음과 같이 순차적으로 실행할 수 있습니다.

a, b, c=1, 2, 3
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

in, is 연산자

객체들의 참조위치의 동일성 여부를 확인하기 위해 연산자 is를 적용할 수 있습니다. 또한 여러 요소들로 구성된 객체의 경우 각 요소와 객체의 소유 관계를 나타내기 위해 연산자 in을 사용합니다. 표 4는 이 두 연산자에 대해 소개하고 있습니다.

표 4 in, is 연산자
연산자 의미
x is not y x,y가 동일하면 False
x is y x,y가 동일하면 True
x in y x가 y의 원소이면 True
x not in y x가 y의 원소가 아니면 True
x='python'
y='python practice'
x is y
False
x is not y
True
x=[1,2, 'apple', 7]
 'apple' in x
True
10 in x
False
7 not in x
False

가변연산자('*')

객체의 참조는 일대일로 이루어집니다. 다음 코드는 다중할당을 실행하는 것으로 객체 a, b는 순차적으로 각 값 1과 2를 참조합니다. 나머지 두 개 3과 4를 할당받는 객체 두 개가 필요하지만 연산자 asterik(*)과 연결된 객체 c는 이 두 값을 모두 참조할 수 있습니다. 이 연산자를 가변연산자, 그 대상을 가변객체라고 합니다.

a, b, *c=1,2,3,4
print(a)
print(b)
print(c)
1
2
[3, 4]

위 코드에서 *c는 a와 b에 할당받고 남은 요소들을 모두 할당받습니다. 위와 반대로 할당되는 값이 부족한 경우 객체 가변 객체인 c에는 할당될 데이터가 없는 상태이므로 빈 객체가 생성됩니다. 다시 말하면 가변객체가 참조할 수 있는 객체의 크기는 코드의 실행 중에 결정되므로 일대일로 참조하는 객체들의 실행이 완료된 다음에 가변객체가 할당이 이루어 집니다.

a, b, *c=1,2
print(a)
print(b)
print(c)
1
2
[]

위와 같은 상황으로 가변 객체를 c에서 b로 변경하면 가변객체인 b의 실행은 a, c의 할당이 이루어진 후에 실행됩니다. 그러나 b에 할당할 값이 없는 상태이므로 빈 객체가 됩니다.

a, *b, c=1,2
print(a)
print(b)
print(c)
1
[]
2
a, *b, c=1,2,3,4
print(a)
print(b)
print(c)
1
[2,3]
4

위 코드 결과와 같이 연산자 *와 연결된 객체의 크기는 가변적입니다. 위 결과들로부터 할당하기 위한 값의 수가 객체의 수보다 많을 경우 할당 순서가 지켜집니다. 그러나 값의 수가 작을 경우 가변객체에 할당은 이루어지지 않습니다. 이 순서의 혼동 때문에 일반적으로 가변객체는 순서상 마지막에 입력됩니다.

댓글

이 블로그의 인기 게시물

[python] 밑줄과 내장메소드(Underscores & Built-in method)

밑줄과 내장 메소드(Underscores & Built-in method) 1. 밑줄의 유형 단일 및 이중 밑줄(" _, __ ")은 일부는 단지 관례적으로 사용되지만 클래스를 초기화시키기 위해 적용되는 내장 메서드인 생성자 __init__() 와 같이 일부는 파이썬 변수 및 메서드에 첨가하여 특정한 의미를 부여합니다. 대략적으로 다음과 같이 분류할 수 있습니다. 단일 선행 밑줄: _var 변수 또는 메서드가 내부 사용을 위한 것임을 나타내는 규칙 단일 선행밑줄의 객체를 와일드카드(*)로 호출할 경우를 제외하고 실행상 차이는 없음 단일 후행 밑줄: var_ 후행 밑줄(접미사)은 규칙에 따라 파이썬 키워드와의 이름 충돌을 피하기 위해 사용됩니다. 이중 선행 밑줄: __var 작동영역을 한정시킴 이중 선행 및 후행 밑줄: __var__ 파이썬 클래스에 공통적으로 사용되는 내장 메소드(매직 메소드)를 나타내기 위한 명명 규칙 단일 밑줄:_ 임시 또는 중요하지 않은 변수를 나타낼 경우 사용되는 명명규칙 2. 단일 선행 밑줄(Single leading underscore) 변수 및 메서드 이름과 관련하여 단일 밑줄 접두사는 관례적으로 사용하는 것으로 프로그램의 동작에는 영향을 미치지 않습니다. 다시 말해 단일 밑줄로 시작하는 변수 또는 메서드는 내부 사용을 위한 것임을 암시하기 위해 사용합니다. 파이썬은 Java와 같이 "개인" 변수와 "공용" 변수를 크게 구분하지 않기 때문에 실행 상 어떤 변화를 나타내지 않습니다. class test: def __init__(self): self.foo=11 self._bar=23 t=test() t.foo 11 t._bar 23 단일 밑줄 접두사는 단지 합의된 규칙이기 이므로 클래스 test의 속성 _bar 의 실행은 정상적으로 이루어집니다. ...

[python] 이스케이프 문자(escape character)

Escape sequence 문자열을 작성할 경우 여러 상황에 사용되는 특수문자가 존재합니다. 예를 들어 문자열에 대화의 문구를 사용할 경우 따옴표를 표시할 수 없습니다. 문자열 자체가 따옴표로 처리되므로 따옴표 본래의 표시는 사용할 수 없기 때문입니다. 이러한 경우 세개의 따옴표(''' ''', 또는 """ """) 또는 역슬래시("\")를 사용하여 나타낼 수 있습니다. print("He said, "What's there?") SyntaxError: invalid syntax print('''He said, "What's there?"''') He said, "What's there?" print("""He said, "What's there?" """) He said, "What's there?" print("He said, \"What's there?\" ") He said, "What's there?" 위 결과와 같이 역슬래시를 사용하여 각 기호 본래의 의미를 나타낼 수 있습니다. 이렇게 어떤 상황을 지정하여 사용되는 기호나 문자들을 이스케이프 문자(escape character) 라고 합니다. 표 1은 일반적으로 사용하는 이스케이프 문자를 나타낸 것입니다. 표 1 이스케이프 문자 Escape 설명 \ 이스케이프 문자임을 나타내기 위해 사용 백슬레시를 나타냄 (\) \', \" 작은 따옴표와 큰 따옴표 \a 벨, 경고음 등을 나타낼 때 사용됨 \b 백스페이스 ...