기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 얕은 복사(shallow copy)와 깊은 복사(deep copy)

얕은 복사(shallow copy)와 깊은 복사(deep copy)

객체들의 참조나 요소의 같음과 다름은 두 값이 같음의 여부를 판정하는 연산자 ==와 키워드 is로 확인할 수 있습니다.

a=[1, 2, 3]
b=a; b
[1, 2, 3]
a==b
True

위 결과는 두 객체의 값이 같음을 의미합니다. 그러나 이 결과가 두 객체의 참조점의 위치를 같음을 의미하지는 않습니다. 즉, 위 결과는 다음의 결과를 보장하지 않습니다.

id(a[1])==id(b[1])
True

위 두 코드와 같이 값과 참조점의 위치가 같음은 키워드 is에 의해 확인할 수 있습니다.

a is b
True

위 코드의 객체 b는 a를 할당한 것으로 동일한 위치에 있는 요소들을 참조합니다. 다음 코드의 list()는 리스트 자료형의 객체를 생성하는 내장함수입니다. 이 함수에 의해 생성된 객체는 같은 값을 포함하지만 다른 참조점을 가집니다. 즉, 다른 객체입니다.

c=list(a); c
[1, 2, 3]
a==c
True
a is c
False

위의 객체들 중에 b의 첫 번째 요소값을 변경시키면 같은 참조점을 가지는 a 역시 수정됩니다. 그러나 다른 객체인 c에는 영향을 주지 않습니다.

b[0]=100; b
[100, 2, 3]
a
[100, 2, 3]
c
[1, 2, 3]

결과적으로 위의 객체 b와 c는 a를 복사한 것입니다. 그러나 b와 c는 다른 객체입니다. 이와 같이 파이썬은 객체가 객체를 복사하는 2가지 방법을 가지고 있습니다(그림 1)

얕은 복사(shallow copy)
  • 위 a와 b 객체의 관계
  • 동일한 참조점에 있는 요소들을 포함
  • 얕은 복사에 있는 객체는 서로 연결되어 있음
깊은 복사(deep copy)
  • 위 a와 c 객체의 관계
  • 동일한 요소들을 가지지만 각 요소의 참조점은 다릅니다.
  • 다른 객체로서 서로 영향을 주지 않음

이 관계를 그림 1과 같이 나타낼 수 있습니다.

그림 1. 얕은복사와 깊은복사.

댓글

이 블로그의 인기 게시물

[python] 모듈(Module), 패키지(Package)

모듈(Module), 패키지(Package) 프로그램 중 실행가능한 일정한 부분을 그룹화할 수 있습니다. 즉, 그 부분에 이름을 부여하여 객체로 만들어 동일한 작업이 필요할 경우마다 그 객체를 참조하여 사용할 수 있습니다. 그러므로 그 분리된 객체 자체가 프로그램이 되며 모듈(Module) 이라고 합니다. 동일한 자료형을 사용하는 여러개의 모듈을 하나의 디렉터리내로 묶을 필요가 있습니다. 이것을 패키지(package) 라고 합니다. 파이썬에서 사용할 수 있는 다양한 패키지의 존재하며 계속 생성되고 업데이트되고 있습니다. 이와 같이 큰 프로그램을 모듈화하여 사용하는 것은 프로그램의 실행과 수정, 복구 등 다양한 측면에서 유리합니다. 모듈(Module) 객체 정의(definition)와 문(statement)을 포함하는 파일 파이썬에서 생성하는 모듈의 확장명은 .py입니다. 프로그램을 실행 가능한 부분들의 조합으로 작성하기 위해 사용 모듈 전체 또는 일부를 다른 모듈, 프로그램 또는 인터프리터에서 호출하여 사용할 수 있습니다. 예를 들어 객체를 작성하여 확장자 " .py " 형식으로 별도의 파일에 저장한다면 모듈이 됩니다. 모듈/패키지의 import " 임포트(import) "는 파이썬을 작성하고 실행하는 코드 해석기(interpreter)에 모듈을 장착하는 명령 키워드입니다. 다음은 두 수를 더하는 사용자 정의 함수로 별도의 파일(test.py)에 저장된 것입니다. 이 함수는 파이썬 인터프리터의 모든 영역에서 사용할 수 있습니다. 그러나 파이썬 자체를 종결한 후 생성한 함수도 소멸되므로 추후에 사용하기 위해 별도의 파일로 저장합니다. 이렇게 저장된 파이썬 파일이 모듈이 됩니다. def add(a, b): return a+b 위 파일을 모듈로 사용하기 위해 실행파일에서 test.py를 임포트 합니다. 임포트 된 모듈의 함수를 사용하는 경우 식 1과 같이 그 함수의 모듈...

[python] 객체의 유효범위

객체의 유효범위 내 용 전역(global) 전역변수와 지역변수 전역(global) 이름공간 에 저장된 이름 객체는 특정한 데이터를 참조, 즉 연결(binding) 됩니다. 이 연결은 기본적으로 모듈단위로 이루어집니다. 예를 들어 numpy는 벡터나 행렬 등의 배열을 다루기 위해 특화된 파이썬 패키지입니다. 이 패키지의 array() 함수는 배열을 생성하기 위한 함수로서 다음 코드와 같이 패키지를 장착한 뒤에 식 1과 같이 연결연산자(.) 를 사용하여 함수가 작동할 영역을 지정해 주어야 합니다. import numpy as np x=np.array([1,2,3]);x array([1, 2, 3]) 위 코드의 np.array()는 array() 함수의 작동은 numpy 패키지의 영역으로 한정한다는 것을 의미합니다. 그러므로 다음과 같이 그 함수의 유효범위를 지정하지 않을 경우 에러가 발생합니다. y=array([1,2,3]); y NameError: name 'array' is not defined 이러한 모듈 장착 - 동작의 영역 지정 - 이 불필요한 기본 파이썬을 파이썬 코어(core) 라고 하며 이 코어 프로그램은 파이썬 작성에 필수적인 다양한 함수를 포함하고 있습니다. 이러한 함수를 내장함수(built-in function) 라고 합니다. 각 모듈은 고유한 자료형 또는 형식을 가지고 있습니다. 그러므로 그 모듈을 사용하기 위해서는 입력할 자료의 형식을 그 유형에 적합하도록 변환됩니다. 이러한 변환은 객체 생성시 자동으로 부여되는 여러 속성(내장 속성) 때문에 가능합니다. 또한 특정한 모듈 또는 패키지의 객체에 내장함수가 작동하는 이유 역시 이러한 속성 때문입니다. 예를 들어 다음 코드의 객체의 길이를 반환하는 내장 함수 len() 은 특정한 작동영역을 지정하지 않고 사용할 수 있으며 다른 모듈에서 생성된 객체에 대해서도 작동합니다. 즉, 내장함수는 파이썬 코어가 작동하는 모든 범위에서 작동합니다. ...

[python] 다줄(multiline) 입력과 주석(comments)

Multi line 입력 긴 단일 명령은 괄호나 역슬래시(\)를 사용하여 여러줄로 구분하여 입력할 수 있습니다. a = 1 + 2 + 3 +\ 4 + 5 + 6 +\ 7 + 8 + 9 a 45 또는 다음과 같이 괄호 '()', '[ ]','{}' 등으로 자료를 여러줄로 구분하여 입력할 수 있습니다. str=["apple","watermelon", "computer","car", "book", "pencile"] str ['apple', 'watermelon', 'computer', 'car', 'book', 'pencile'] 주석(comments) 주석은 코드에 대한 설명 등 정보를 입력하기 위한 것으로 코드를 실행하는 과정에서 무시되는 부분입니다. 그러나 코드를 사용하는 다른 사용자(user)들이나 자신이 작성한 코드를 추후에 다시 고려할 때 그 코드를 이해하는 중요한 키가 됩니다. 한 줄 주석은 hash(#) 시작으로 작성합니다. 여러줄의 주석은 세개의 작은 따옴표(''' ~''') 또는 세개의 큰 따옴표(""" ~ """)로 작성할 수 있습니다. #주석은 hash를 시작으로 작성됩니다. #다음은 "Hello"를 출력하라는 코드입니다. print("Hello") Hello """ 여러줄에 코드를 분리하여 작성할 경우 역슬래시를 사용합니다.""" a= 1+2+3+\ 4+5+6+\ 7+8+9 a 45 위에서 소개한 3개의 따옴표는 Docstring을 작성하기 위해 사용됩니다...