기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를

[python] 파일 운용(File Operation)

파일 운용(File Operation)

파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다.

표 1 파일 운용을 위한 함수
순서함수/메소드내용
1open() 파일 열기, 함수
2write() 쓰기(입력) , 메소드
2read() 읽기 , 메소드
3close()파일 닫기, 메소드

파일 열기/생성

파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open()을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다.

표 2 open() 함수의 mode 종류
mode 의  미
'r' 읽기전용(기본값)
'w' 쓰기 전용,
파일이 존재하지 않으면 새로운 파일이 생성되고
파일이 존재한다면 이전 내용은 지워집니다.
'x' 파일 생성, 파일이 존재한다면 에러발생
'a' 파일의 기존 내용의 끝에 첨가되고
파일이 존재하지 않는 경우 새 파일이 생성
't' 파일을 text 모드로 엽니다(기본).
'b' 파일을 이진모드로 엽니다.
'+' 파일을 업데이트하기 위해 오픈합니다.
사용방식은 r 과 w를 모두 사용합니다.

open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를 종결시켜야 합니다. 이 경우 메서드 .close()를 사용합니다.

다음 fopen()를 사용하여 호출한 파일입니다. 파일의 저장 디렉토리가 현재 실행되고 있는 인터프리터와 같은 위치라면 다음과 같이 파일명만으로 호출할 수 있습니다.

f=open("test.txt", 'r', encoding='UTF-8')
f
<_io.TextIOWrapper name='test.txt' mode='r' encoding='UTF-8'>

호출된 파일을 종결은 .close() 메소드의 실행으로 이루어집니다.

f.close()

.close() 메서드는 파일이 실행 중에 있는 경우 에러가 발생하면서 종결되지 않습니다. 에러의 유발을 방지하면서 파일의 실행여부와 상관없이 종결하기 위해 식 1과 같이 try ~ finally 구문을 사용할 수 있습니다. 이 구문은 except 문을 생략한 것으로 try 문의 실행이 종결된 후에 finally 문이 실행됩니다.

try:
    f.open('test.txt')
finally:
    f.close()
(식 1)

파일에 쓰기

파일에 내용을 입력하기 위해서는 open() 사용시 mode를 'w', 'a', 또는 'x'를 적용해야 합니다. 'w'는 기존의 파일이 존재하는 경우 덮어쓰기로 이전의 내용은 지워지므로 주의해야 합니다. 내용 입력은 쓰기 모드로 연후 메서드 .write()를 사용합니다.

하나의 객체에 여러가지 작업을 할 경우 다음과 같이 with 구문을 사용하는 것이 편리합니다(with 문 참조). with 구문은 다양한 하위문들을 포함하는 블럭(block)을 형성합니다. 블럭의 종료는 하위문의 실행 완료와 함께 이루어집니다. 그러므로 with 문 적용 시 .close() 메소드를 별도로 실행할 필요가 없습니다.

다음은 test.txt라는 새로운 파일을 생성하고 문자열을 입력한 것입니다. 입력 내용들 중 줄바꿈을 위해 이스케이프 문자 "\n"을 사용하였습니다.

with open("test.txt", 'w', encoding='UTF-8') as f:
    f.write("This is test file for open(). \n")
    f.write("Escape characters, '\n' is used for newline.")

파일 내용 읽기

열린 파일의 내용을 읽기 위해 표 3에 나타낸 다양한 메서드들을 사용합니다.

표 3 open()에 의한 파일을 읽기 위한 메소드 size: 문자수
메소드내용
.read(size)지정한 문자수(size) 만큼의 내용을 읽음
size를 지정하지 않으면 모든 내용을 호출
.readline(size)한 줄씩 읽음
size를 지정하면 그 줄의 지정한 문자만큼을 호출
.readlines()모든 내용을 줄단위로 읽음
리스트로 반환
.tell()읽어들인 문자의 총 수
.seek(0)읽기 모드의 초기화

열린 파일에서 읽어들인 내용을 다시 호출할 수 없습니다.

f=open('test.txt')
f.read()
"This is test file for open(). \nEscape characters, '\n' is used for newline."

호출한 부분의 처음부터 3개의 문자만을 읽습니다.

f=open('test.txt')
f.read(3)
'Thi'

읽은 문자의 총수를 확인하기 위해 tell() 메소드를 사용할 수 있습니다.

f.tell()
3

파일에서 read() 메소드로 실행된 부분은 다시 호출될 수 없습니다. 그러므로 다음의 명령은 읽어들인 총 문자수의 다음부터 시작됩니다. 빈공간(white space) 역시 문자로 간주됩니다.

 f.read(3)
 's i'
f.read()
"s test file for open(). \nEscape characters, '\n' is used for newline."
f.tell()
 74
 f.read()
 ''
 f.seek(0)
0
f.tell()
0
f.read(1)
 'T'

.seek(0)는 읽기모드를 초기화 시킵니다. 즉, 읽기위해 호출한 문자의 최종 위치를 다시 읽기 시작하는 단계로, 즉 첫 문자의 위치로 환원시킵니다.

read()는 글자 단위로 지정한 크기만큼의 내용을 읽습니다. 이외에 다음 메소드를 사용하여 줄단위로 읽어들일수 있습니다.

f=open("test.txt")
f.readline()
'This is test file for open(). \n'
f.seek(0)
0
f.readlines()
 ['This is test file for open(). \n',
  "Escape characters, '\n",
  "' is used for newline."]

댓글

이 블로그의 인기 게시물

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II 비트 연산자(Bitwise operators) 특수한 연산자 재할당연산자 다중할당 in, is 연산자 가변연산자('*') 비트 연산자(Bitwise operators) 컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다. 2진수로 변환 동일한 위치에 저장된 값들 사이에 비트단위로 연산 예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다. 표 1 2와 10의 비트 연산 십진수 이진수 2 0 0 1 0 10 1 0 1 0 (+)12 1 1 0 0 비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법 을 적용합니다. 표 2 비트 연산자 연산자 의미 x & y 비트 단위로 AND x | y 비트 단위로 OR ~x 비트 단위로 NOT, 1의 보수(complement) x^y 비트 단위로 XOR (다른 값: True(1), 같은 값: False(0)) x >> a 객체 x를 오른쪽으로 a 비트 이동 x << a 객체 x를 왼쪽으로 a 비트 이동 표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에

[python] 연산자(Operator) I: 산술, 비교, 논리 연산자

1.4 연산자(operator) 산술 연산자 비교 연산자 논리연산자(logical operators) 비트 연산자 특수한 연산자 데이터들 사이에 연산이 필요한 경우 연산의 종류를 구분하기 위한 약속이 존재합니다. 이 약속된 규칙 또는 표현을 연산자(operator) 라고 합니다. 연산자는 특정한 명령(들)을 수행하기 위한 여러 코드들을 그룹화하는 함수 입니다. 파이썬은 산술, True 또는 False의 결과를 반환하는 논리 연산 등을 수행하기 위한 다양한 연산자들을 제공하고 있으며 이 연산에 참여하는 값들을 피연산자(operand) 라고 합니다. 예를 들어 다음 코드는 두 수치형 리터럴의 덧셈을 실행한 것입니다. 5+8 13 두 정수의 덧셈연산은 연산자 ' + '에 의해 실행되며 이 연산에 관계된 5와 8이 피연산자가 됩니다. 그 연산의 결과는 13입니다. 산술 연산자(Arithmatic operators) 표 1은 두 객체에 대한 산술 연산을 실행하기 위한 연산자 입니다. 표 1 산술연산자 연산자 의미 x + y 단일 또는 두개의 피연사자의 덧셈 x - y 단일 또는 두개의 피연사자의 뺄셈 x * y 두개의 피연사자의 곱셈 x / y 두개의 피연사자의 나눗셈으로 결과는 실수형 x % y 두개의 피연사자의 나눗셈의 나머지를 반환 x // y 두개의 피연사자의 나눗셈의 몫을 반환 x**y 피연산자의 거듭제곱 (power) x=5 y=2 print(x+y) # 덧셈 print(x-y) # 뺄셈 print(x*y) # 곱셈 print(x/y) # 나눗셈 7 3 10 2.5 print(x//y) # 몫 print(x%y) # 나머지 2 1 print(x**y) # 거듭제곱 25

[python] 객체(Object)와 참조(Reference)

객체(Object)와 참조(Reference) 객체(Object) 다음 코드 ①은 단순히 숫자를 입력한 것입니다. 3  # ① 3 그러나 코드 ①로 생성된 3은 실행 후에 다시 호출할 수 없습니다. 반면에 다음 코드 ②는 할당 연산자 ' = '를 사용하여 왼쪽의 이름에 오른쪽의 값을 할당한 것으로 3을 호출할 수 있는 이름이 존재합니다. 즉, x를 사용하여 3을 호출할 수 있습니다. 특정한 동작을 일으키는 기호를 연산자(operator)라고 하며 등호(=)의 경우 오른쪽의 값을 왼쪽에 할당한다는 의미로 할당연산자(assignment operator) 라고 합니다. x=3 #② x 3 코드 ③은 코드 ②값과 다른 값의 합의 결과를 y에 할당한 것입니다. y=x+7 #③ y 10 위 코드 ①과 ②의 차이는 코드 ③에서와 같이 재사용 여부에 있습니다. 즉, '3'이라는 숫자에 이름을 부여하여 재사용 할 수 있습니다. 이와 같이 파이썬 코드에 의해 생성되어 저장된 상태로 재사용이 가능한 대상을 객체(object) 라고 합니다. 즉, 다음 그림 1과 같이 객체는 저장된 데이터를 가리키는 이름과 연결된 상태(참조상태)입니다. 위 코드 ②의 할당 과정은 메모리에 저장된 3이라는 숫자에 이름 x를 부여한 것이라고 할 수 있습니다. 자세히 소개하면 x와 3의 저장 위치는 다르며 x는 값 3의 저장 위치값을 가지고 있습니다. 그러므로 연산자 "="는 왼쪽과 오른쪽이 같다는 의미가 아니고 오른쪽 값을 왼쪽에 할당한다것을 의미합니다. 단순하게 생각하면 파이썬은 메모리를 두 종류로 구분하여 사용합니다. 하나는 실제 데이터들이 저장되는 공간이고 다른 하나는 코드 ②와 ③같이 부여된 이름들을 저장하는 이름공간(namespace) 입니다. 그림 1과 같이 코드 ②의 이름 x는 이름공간에 위치하며 데이터 공간의 값 3과 연결(binding)되는 것으로 이 관계를 참조(reference) 라고 표시 합니다. 결과적으