기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 파일 운용(File Operation)

파일 운용(File Operation)

파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다.

표 1 파일 운용을 위한 함수
순서함수/메소드내용
1open() 파일 열기, 함수
2write() 쓰기(입력) , 메소드
2read() 읽기 , 메소드
3close()파일 닫기, 메소드

파일 열기/생성

파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open()을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다.

표 2 open() 함수의 mode 종류
mode 의  미
'r' 읽기전용(기본값)
'w' 쓰기 전용,
파일이 존재하지 않으면 새로운 파일이 생성되고
파일이 존재한다면 이전 내용은 지워집니다.
'x' 파일 생성, 파일이 존재한다면 에러발생
'a' 파일의 기존 내용의 끝에 첨가되고
파일이 존재하지 않는 경우 새 파일이 생성
't' 파일을 text 모드로 엽니다(기본).
'b' 파일을 이진모드로 엽니다.
'+' 파일을 업데이트하기 위해 오픈합니다.
사용방식은 r 과 w를 모두 사용합니다.

open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를 종결시켜야 합니다. 이 경우 메서드 .close()를 사용합니다.

다음 fopen()를 사용하여 호출한 파일입니다. 파일의 저장 디렉토리가 현재 실행되고 있는 인터프리터와 같은 위치라면 다음과 같이 파일명만으로 호출할 수 있습니다.

f=open("test.txt", 'r', encoding='UTF-8')
f
<_io.TextIOWrapper name='test.txt' mode='r' encoding='UTF-8'>

호출된 파일을 종결은 .close() 메소드의 실행으로 이루어집니다.

f.close()

.close() 메서드는 파일이 실행 중에 있는 경우 에러가 발생하면서 종결되지 않습니다. 에러의 유발을 방지하면서 파일의 실행여부와 상관없이 종결하기 위해 식 1과 같이 try ~ finally 구문을 사용할 수 있습니다. 이 구문은 except 문을 생략한 것으로 try 문의 실행이 종결된 후에 finally 문이 실행됩니다.

try:
    f.open('test.txt')
finally:
    f.close()
(식 1)

파일에 쓰기

파일에 내용을 입력하기 위해서는 open() 사용시 mode를 'w', 'a', 또는 'x'를 적용해야 합니다. 'w'는 기존의 파일이 존재하는 경우 덮어쓰기로 이전의 내용은 지워지므로 주의해야 합니다. 내용 입력은 쓰기 모드로 연후 메서드 .write()를 사용합니다.

하나의 객체에 여러가지 작업을 할 경우 다음과 같이 with 구문을 사용하는 것이 편리합니다(with 문 참조). with 구문은 다양한 하위문들을 포함하는 블럭(block)을 형성합니다. 블럭의 종료는 하위문의 실행 완료와 함께 이루어집니다. 그러므로 with 문 적용 시 .close() 메소드를 별도로 실행할 필요가 없습니다.

다음은 test.txt라는 새로운 파일을 생성하고 문자열을 입력한 것입니다. 입력 내용들 중 줄바꿈을 위해 이스케이프 문자 "\n"을 사용하였습니다.

with open("test.txt", 'w', encoding='UTF-8') as f:
    f.write("This is test file for open(). \n")
    f.write("Escape characters, '\n' is used for newline.")

파일 내용 읽기

열린 파일의 내용을 읽기 위해 표 3에 나타낸 다양한 메서드들을 사용합니다.

표 3 open()에 의한 파일을 읽기 위한 메소드 size: 문자수
메소드내용
.read(size)지정한 문자수(size) 만큼의 내용을 읽음
size를 지정하지 않으면 모든 내용을 호출
.readline(size)한 줄씩 읽음
size를 지정하면 그 줄의 지정한 문자만큼을 호출
.readlines()모든 내용을 줄단위로 읽음
리스트로 반환
.tell()읽어들인 문자의 총 수
.seek(0)읽기 모드의 초기화

열린 파일에서 읽어들인 내용을 다시 호출할 수 없습니다.

f=open('test.txt')
f.read()
"This is test file for open(). \nEscape characters, '\n' is used for newline."

호출한 부분의 처음부터 3개의 문자만을 읽습니다.

f=open('test.txt')
f.read(3)
'Thi'

읽은 문자의 총수를 확인하기 위해 tell() 메소드를 사용할 수 있습니다.

f.tell()
3

파일에서 read() 메소드로 실행된 부분은 다시 호출될 수 없습니다. 그러므로 다음의 명령은 읽어들인 총 문자수의 다음부터 시작됩니다. 빈공간(white space) 역시 문자로 간주됩니다.

 f.read(3)
 's i'
f.read()
"s test file for open(). \nEscape characters, '\n' is used for newline."
f.tell()
 74
 f.read()
 ''
 f.seek(0)
0
f.tell()
0
f.read(1)
 'T'

.seek(0)는 읽기모드를 초기화 시킵니다. 즉, 읽기위해 호출한 문자의 최종 위치를 다시 읽기 시작하는 단계로, 즉 첫 문자의 위치로 환원시킵니다.

read()는 글자 단위로 지정한 크기만큼의 내용을 읽습니다. 이외에 다음 메소드를 사용하여 줄단위로 읽어들일수 있습니다.

f=open("test.txt")
f.readline()
'This is test file for open(). \n'
f.seek(0)
0
f.readlines()
 ['This is test file for open(). \n',
  "Escape characters, '\n",
  "' is used for newline."]

댓글

이 블로그의 인기 게시물

[python] 컴퓨터에서 숫자를 다루는 방식

컴퓨터에서 숫자를 다루는 방식 정수의 표현방식 부동소수점(float), 실수의 표현 숫자형의 표현범위 사용자가 입력한 값은 컴퓨터 저장 장치에 비트(bit) 단위로 1 또는 0으로 저장됩니다. 결과적으로 컴퓨터 연산은 2진수로 이루어집니다. 정수의 표현방식 다음 식은 컴퓨터에서 5를 저장하거나 연산하기 위해 이진수로 변환한 것입니다. 5 = 1 × 2 2 + 0 × 2 1 + 1 × 2 0 위와 같이 십진수 5는 이진수 101로 변환되며 그 이진수 값은 다음과 같이 아래첨자로 진수를 표현합니다. 일반적으로 십진수에 대한 아래첨자는 생략됩니다. 5 (10) = 101 (2) 1 비트로 표현할 수 있는 수는 0 또는 1이므로 비트수에 대한 표현 용량은 다음과 같이 계산됩니다. c = 2 n ,  c: Capacity, n: 비트수 그러므로 8비트에서의 표현할 수 있는 수는 다음과 같이 256이므로 0 ~ 255까지 나타낼 수 있습니다. 2**8 256 정수인 경우는 음과 양의 사인(sign)을 저장하기 위해 최왼쪽의 1비트가 예약되므로 숫자는 최대 7비트를 사용할 수 있습니다. 양수를 0 음수를 1로 처리합니다. 그러므로 수를 저장하기 위한 비트는 7개로 양수의 최대값은 0111111 (2) 이 됩니다. 이는 127 (10) 이 됩니다. 컴퓨터에서 음수를 직접적으로 표현할 수 없기 때문에 부호 비트를 지정하여 양수에 대한 음수는 2의 보수(tow's complement) 를 사용하여 나타낼 수 있습니다. 일정한 비트수를 기준으로 이진수로 변환할 수 있는 십진수의 범위는 다음과 같이 계산할 수 있습니다. -2 n-1 ~ 2 n-1 - 1, n: 비트수 십진수 정수를 2진수로 전환하기 위해 내장함수 int() , bin() 을 적용합니다. int('0b01111111', 2) 127 int('0b10000000', 2) 1...

[python] 객체의 유효범위

객체의 유효범위 내 용 전역(global) 전역변수와 지역변수 전역(global) 이름공간 에 저장된 이름 객체는 특정한 데이터를 참조, 즉 연결(binding) 됩니다. 이 연결은 기본적으로 모듈단위로 이루어집니다. 예를 들어 numpy는 벡터나 행렬 등의 배열을 다루기 위해 특화된 파이썬 패키지입니다. 이 패키지의 array() 함수는 배열을 생성하기 위한 함수로서 다음 코드와 같이 패키지를 장착한 뒤에 식 1과 같이 연결연산자(.) 를 사용하여 함수가 작동할 영역을 지정해 주어야 합니다. import numpy as np x=np.array([1,2,3]);x array([1, 2, 3]) 위 코드의 np.array()는 array() 함수의 작동은 numpy 패키지의 영역으로 한정한다는 것을 의미합니다. 그러므로 다음과 같이 그 함수의 유효범위를 지정하지 않을 경우 에러가 발생합니다. y=array([1,2,3]); y NameError: name 'array' is not defined 이러한 모듈 장착 - 동작의 영역 지정 - 이 불필요한 기본 파이썬을 파이썬 코어(core) 라고 하며 이 코어 프로그램은 파이썬 작성에 필수적인 다양한 함수를 포함하고 있습니다. 이러한 함수를 내장함수(built-in function) 라고 합니다. 각 모듈은 고유한 자료형 또는 형식을 가지고 있습니다. 그러므로 그 모듈을 사용하기 위해서는 입력할 자료의 형식을 그 유형에 적합하도록 변환됩니다. 이러한 변환은 객체 생성시 자동으로 부여되는 여러 속성(내장 속성) 때문에 가능합니다. 또한 특정한 모듈 또는 패키지의 객체에 내장함수가 작동하는 이유 역시 이러한 속성 때문입니다. 예를 들어 다음 코드의 객체의 길이를 반환하는 내장 함수 len() 은 특정한 작동영역을 지정하지 않고 사용할 수 있으며 다른 모듈에서 생성된 객체에 대해서도 작동합니다. 즉, 내장함수는 파이썬 코어가 작동하는 모든 범위에서 작동합니다. ...

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II 비트 연산자(Bitwise operators) 특수한 연산자 재할당연산자 다중할당 in, is 연산자 가변연산자('*') 비트 연산자(Bitwise operators) 컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다. 2진수로 변환 동일한 위치에 저장된 값들 사이에 비트단위로 연산 예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다. 표 1 2와 10의 비트 연산 십진수 이진수 2 0 0 1 0 10 1 0 1 0 (+)12 1 1 0 0 비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법 을 적용합니다. 표 2 비트 연산자 연산자 의미 x & y 비트 단위로 AND x | y 비트 단위로 OR ~x 비트 단위로 NOT, 1의 보수(complement) x^y 비트 단위로 XOR (다른 값: True(1), 같은 값: False(0)) x >> a 객체 x를 오른쪽으로 a 비트 이동 x << a 객체 x를 왼쪽으로 a 비트 이동 표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에...