기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 객체(Object)와 참조(Reference)

객체(Object)와 참조(Reference)

객체(Object)

다음 코드 ①은 단순히 숫자를 입력한 것입니다.

3  # ①
3

그러나 코드 ①로 생성된 3은 실행 후에 다시 호출할 수 없습니다. 반면에 다음 코드 ②는 할당 연산자 '='를 사용하여 왼쪽의 이름에 오른쪽의 값을 할당한 것으로 3을 호출할 수 있는 이름이 존재합니다. 즉, x를 사용하여 3을 호출할 수 있습니다.

특정한 동작을 일으키는 기호를 연산자(operator)라고 하며 등호(=)의 경우 오른쪽의 값을 왼쪽에 할당한다는 의미로 할당연산자(assignment operator)라고 합니다.

x=3 #②
x
3

코드 ③은 코드 ②값과 다른 값의 합의 결과를 y에 할당한 것입니다.

y=x+7 #③
y
10

위 코드 ①과 ②의 차이는 코드 ③에서와 같이 재사용 여부에 있습니다. 즉, '3'이라는 숫자에 이름을 부여하여 재사용 할 수 있습니다. 이와 같이 파이썬 코드에 의해 생성되어 저장된 상태로 재사용이 가능한 대상을 객체(object)라고 합니다. 즉, 다음 그림 1과 같이 객체는 저장된 데이터를 가리키는 이름과 연결된 상태(참조상태)입니다.

위 코드 ②의 할당 과정은 메모리에 저장된 3이라는 숫자에 이름 x를 부여한 것이라고 할 수 있습니다. 자세히 소개하면 x와 3의 저장 위치는 다르며 x는 값 3의 저장 위치값을 가지고 있습니다. 그러므로 연산자 "="는 왼쪽과 오른쪽이 같다는 의미가 아니고 오른쪽 값을 왼쪽에 할당한다것을 의미합니다. 단순하게 생각하면 파이썬은 메모리를 두 종류로 구분하여 사용합니다. 하나는 실제 데이터들이 저장되는 공간이고 다른 하나는 코드 ②와 ③같이 부여된 이름들을 저장하는 이름공간(namespace)입니다. 그림 1과 같이 코드 ②의 이름 x는 이름공간에 위치하며 데이터 공간의 값 3과 연결(binding)되는 것으로 이 관계를 참조(reference)라고 표시 합니다. 결과적으로 파이썬에서 할당은 참조를 의미합니다.

그림 1. 이름공간과 참조.

참조(Reference)

객체에 부여되는 이름은 이름공간(namespace)이라는 별도의 메모리 공간에 저장되어 있습니다. 사용자가 데이터에 이름을 부여하면 파이썬은 객체의 이름을 이름공간에 저장하고 다른 공간에 저장된 데이터와 연결합니다. 다음 코드의 경우 그림 2에서 나타낸 것과 같이 객체 이름 y는 다른 공간에 저장된 10이라는 정수를 연결(binding)합니다. 즉, y는 10을 참조(reference) 합니다.

이러한 참조 방식으로 같은 데이터(값)를 나타내는 여러개의 객체를 생성할 경우 실제로 데이터는 하나의 데이터만이 생성되기 때문에 메모리 관리면에서 효율적이지만 이름공간의 y가 실제 값 10을 호출하기 위한 시간이 필요하므로 y와 10이 같은 위치에 존재하는 방식에 비해 처리 속도면에서 불리합니다.

다음 코드는 10을 참조하는 y를 다른 이름의 z에 재할당한 것입니다. 결과적으로 그림 2와 같이 y와 z은 같은 값과 연결되어 있습니다.

z=y
z
10

다음 코드의 세미콜론(;)은 명령의 종결을 의미합니다. 그러므로 "10을 y에 할당"과 "y를 호출"하는 명령을 분리하기 위해 사용한것입니다.

y=10; y
10
y 10
z
그림 2. 동일한 객체의 참조.

y와 z이 같은 데이터를 참조한다는 것은 각 이름과 연결된 객체가 같은 주소임을 의미합니다. 이것은 이름 객체가 참조하는 데이터(객체)의 위치를 반환하는 내장함수인 id()에 의해 확인할 수 있습니다.

id(y), id(z)
(140715628532808, 140715628532808)

컴퓨터 램위에 데이터의 저장 위치는 랜덤으로 결정되므로 id()의 결과는 다를 수 있습니다.

변수 z에 다른 객체를 참조시킨다면 변수 y만이 객체 10을 참조하게 됩니다(그림 3).

z=19
id(z)
140715628533096
y 10
y 19
그림 3. 객체들의 참조.

당연히 변수 y에 다른 값을 할당하면 객체 10을 참조하는 갯수인 참조수는 0이 됩니다(그림 4).

y=1
id(y)
140715628532520
y 1
 10
y 19
그림 4. 참조의 변경

다음 코드의 객체 a와 같이 대괄호 내에 여러개의 값들을 입력하여 하나의 객체로 구성할 수 있습니다. 이러한 객체를 리스트(list)라고 합니다. 다음 코드에서 리스트 객체 [1, 2, 3]을 이름 객체 a에 할당한것과 그 객체 자체의 참조 위치의 같음을 알아보기 위해 연산자 ==를 사용했습니다.

a=[1, 2, 3]
id(a)==id([1, 2, 3])
False

위 결과는 a에 연결된 리스트와 리스트 자체는 다른 것임을 알려줍니다. 이 결과는 다음 코드의 객체 x와 같이 하나의 데이터를 참조하는 경우와 다릅니다. 다음 코드의 객체 3은 메모리에 가장 근원적으로 저장되는 값으로 리터럴(literal)이라고 합니다. 이러한 단일 값(객체)의 참조위치는 이름 객체 x에 가리키는 위치와 같습니다. 그러나 여러값들로 구성되는 리스트는 각각의 값(리터럴)과 연결된 것으로 그림 5와 같이 이중적인 연결구조를 가집니다.

리터럴(literal)은 메모리에 입력되는 원시데이터(raw data), 즉 자신을 참조하는 객체를 의미합니다.

x=3
id(x)==id(3)
True

리스트와 같이 1개 이상의 값을 가진 객체를 생성할 경우 왼쪽의 첫번째 요소부터 0, 1, 2, ... 등의 식별자가 자동으로 할당됩니다. 이 식별자를 각 요소의 인덱스(index)라고 하며 이것을 사용하여 각 값을 개별적으로 호출할 수 있습니다. 예를 들어 a[0]은 1을 참조합니다.

리스트 [1,2,3]은 이름공간의 객체 a와 연결된 것입니다. 다음 코드는 리스트 객체 a와 리스트 자체인 [1, 2, 3]의 각 요소들의 참조 위치를 나타낸 것입니다.

id(a[0]), id(a[1]), id(a[2])
(140715628532520, 140715628532552, 140715628532584)
for i in [1,2,3]:
    print(f'{i}의 id: {id(i)}')
1의 id: 140715628532520
2의 id: 140715628532552
3의 id: 140715628532584

위 코드에서 사용된 for 문은 반복문으로 리스트 객체의 각 요소를 순차적으로 반환하기 위해 사용합니다(반복문 참조). 또한 위 코드의 print(f"")은 다양한 출력방식 중 하나로 2.3절에서 자세히 소개합니다.

위 결과와 같이 각 객체 내에 있는 요소들은 같은 참조점들을 가집니다. 즉, 그림 1.3.5와 같이 [1,2,3]과 a 두 객체는 다르지만 각각 같은 리터럴인 1, 2, 그리고 3을 참조하고 있습니다.

그림 1.3.5. 콜렉션 객체의 참조.

위 결과와 같이 리스트와 같은 여러 값들로 구성되는 컬렉션(collection) 형의 각 요소는 그에 대응하는 고유한 참조를 가집니다. 더구나 그 참조 위치가 랜덤하게 이루어지므로 처리속도면에서 불리합니다. 배열을 다루는 파이썬의 대표적인 라이브러리인 numpy는 리스트를 기반으로 하는 배열(array)이라는 자체적인 자료형을 사용합니다. 이 자료형의 경우 하나의 리스트에 포함된 모든 요소들은 하나의 위치에 저장되므로 파이썬의 참조방식으로 유발하는 느린 속도 문제를 보완합니다.

numpy는 파이썬 패키지로서 별도로 설치하여야 합니다(anaconda를 사용할 경우 기본으로 장착). 또한 사용하기 위해서는 인터프리터에 import 해야 합니다(모듈참조).

import numpy as np
#array 객체
num2=np.array([1,2,3])
num2=np.array([1,2,3])
num2
array([1, 2, 3])
id(num2[0]), id(num2[1]), id(num2[2])
(2847215359504, 2847215359504, 2847215359504)

그 객체의 요소 1개를 다른 값으로 치환하는 경우 객체 자체의 위치가 다른 것입니다. 즉, 다른 객체를 참조하게 됩니다.

num2[2]=100
num2
array([  1,   2, 100])
id(num2[0]), id(num2[1]), id(num2[2])
(2847215359728, 2847215359728, 2847215359728)

댓글

이 블로그의 인기 게시물

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II 비트 연산자(Bitwise operators) 특수한 연산자 재할당연산자 다중할당 in, is 연산자 가변연산자('*') 비트 연산자(Bitwise operators) 컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다. 2진수로 변환 동일한 위치에 저장된 값들 사이에 비트단위로 연산 예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다. 표 1 2와 10의 비트 연산 십진수 이진수 2 0 0 1 0 10 1 0 1 0 (+)12 1 1 0 0 비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법 을 적용합니다. 표 2 비트 연산자 연산자 의미 x & y 비트 단위로 AND x | y 비트 단위로 OR ~x 비트 단위로 NOT, 1의 보수(complement) x^y 비트 단위로 XOR (다른 값: True(1), 같은 값: False(0)) x >> a 객체 x를 오른쪽으로 a 비트 이동 x << a 객체 x를 왼쪽으로 a 비트 이동 표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에...

[python] 연산자(Operator) I: 산술, 비교, 논리 연산자

1.4 연산자(operator) 산술 연산자 비교 연산자 논리연산자(logical operators) 비트 연산자 특수한 연산자 데이터들 사이에 연산이 필요한 경우 연산의 종류를 구분하기 위한 약속이 존재합니다. 이 약속된 규칙 또는 표현을 연산자(operator) 라고 합니다. 연산자는 특정한 명령(들)을 수행하기 위한 여러 코드들을 그룹화하는 함수 입니다. 파이썬은 산술, True 또는 False의 결과를 반환하는 논리 연산 등을 수행하기 위한 다양한 연산자들을 제공하고 있으며 이 연산에 참여하는 값들을 피연산자(operand) 라고 합니다. 예를 들어 다음 코드는 두 수치형 리터럴의 덧셈을 실행한 것입니다. 5+8 13 두 정수의 덧셈연산은 연산자 ' + '에 의해 실행되며 이 연산에 관계된 5와 8이 피연산자가 됩니다. 그 연산의 결과는 13입니다. 산술 연산자(Arithmatic operators) 표 1은 두 객체에 대한 산술 연산을 실행하기 위한 연산자 입니다. 표 1 산술연산자 연산자 의미 x + y 단일 또는 두개의 피연사자의 덧셈 x - y 단일 또는 두개의 피연사자의 뺄셈 x * y 두개의 피연사자의 곱셈 x / y 두개의 피연사자의 나눗셈으로 결과는 실수형 x % y 두개의 피연사자의 나눗셈의 나머지를 반환 x // y 두개의 피연사자의 나눗셈의 몫을 반환 x**y 피연산자의 거듭제곱 (power) x=5 y=2 print(x+y) # 덧셈 print(x-y) # 뺄셈 print(x*y) # 곱셈 print(x/y) # 나눗셈 7 3 10 2.5 print(x//y) # 몫 print(x%y) # 나머지 2 1 print(x**y) # 거듭제곱 25 ...

[python] 밑줄과 내장메소드(Underscores & Built-in method)

밑줄과 내장 메소드(Underscores & Built-in method) 1. 밑줄의 유형 단일 및 이중 밑줄(" _, __ ")은 일부는 단지 관례적으로 사용되지만 클래스를 초기화시키기 위해 적용되는 내장 메서드인 생성자 __init__() 와 같이 일부는 파이썬 변수 및 메서드에 첨가하여 특정한 의미를 부여합니다. 대략적으로 다음과 같이 분류할 수 있습니다. 단일 선행 밑줄: _var 변수 또는 메서드가 내부 사용을 위한 것임을 나타내는 규칙 단일 선행밑줄의 객체를 와일드카드(*)로 호출할 경우를 제외하고 실행상 차이는 없음 단일 후행 밑줄: var_ 후행 밑줄(접미사)은 규칙에 따라 파이썬 키워드와의 이름 충돌을 피하기 위해 사용됩니다. 이중 선행 밑줄: __var 작동영역을 한정시킴 이중 선행 및 후행 밑줄: __var__ 파이썬 클래스에 공통적으로 사용되는 내장 메소드(매직 메소드)를 나타내기 위한 명명 규칙 단일 밑줄:_ 임시 또는 중요하지 않은 변수를 나타낼 경우 사용되는 명명규칙 2. 단일 선행 밑줄(Single leading underscore) 변수 및 메서드 이름과 관련하여 단일 밑줄 접두사는 관례적으로 사용하는 것으로 프로그램의 동작에는 영향을 미치지 않습니다. 다시 말해 단일 밑줄로 시작하는 변수 또는 메서드는 내부 사용을 위한 것임을 암시하기 위해 사용합니다. 파이썬은 Java와 같이 "개인" 변수와 "공용" 변수를 크게 구분하지 않기 때문에 실행 상 어떤 변화를 나타내지 않습니다. class test: def __init__(self): self.foo=11 self._bar=23 t=test() t.foo 11 t._bar 23 단일 밑줄 접두사는 단지 합의된 규칙이기 이므로 클래스 test의 속성 _bar 의 실행은 정상적으로 이루어집니다. ...