기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 숫자형(number typer)

숫자형 (Number type)

기본 연산

파이썬은 마치 계산기와 같이 적합한 식을 전달하는 것에 의해 계산을 할 수 있습니다. 그러므로 그 자체로 훌륭한 계산기로 사용할 수 있습니다. 기본적인 계산을 위해 사용되는 연산자는 일반 수학이나 계산기에서 사용되는 것과 같습니다. 즉, 더하기, 빼기, 곱하기 그리고 나누기 연산자는 각각 +, -, * 그리고 / 기호를 사용합니다.

1+2
3
 0.9+0.231
1.131
 100-27
73
 -2.4-0.9
-3.3
 3*2
6
 3.45*0.12
0.414
 3/2
1.5
 4.23/1.27 ①
3.330708661417323

나누기 연산에서는 일반 계산기와 다르게 특이한 연산자를 사용할 수 있습니다. 위 코드 ①의 답 3.33…과 같은 실수인 경우 // %연산자를 사용하여 몫과 나머지로 표현할 수 있습니다(산술연산자 참조)

4.23//1.27
3.0
4.23%1.27
0.4200000000000004

위 경우는 실수를 실수로 나눈 것으로 정수에 적용해 봅니다.

5/3
1.6666666666666667
5//3
1
5%3
2

위 코드의 5를 3으로 나눈 경우 실수가 반환됩니다. 실수 중에 몫은 정수부분이 되지만 나머지는 이 결과의 소수부분과는 다릅니다. 즉, //, % 연산자에 의한 결과는 모두 정수로 표현됩니다. 위 정수와 정수의 나눗셈의 결과는 실수이며 몫은 정수입니다. 이 경우 실수를 정수로 변환하면 정수인 몫을 나타낼 수 있습니다. 실수를 정수로 변환하기 위해 내장함수인 int()를 적용합니다.

int(5/3)
1

파이썬에서는 수를 일정한 형식으로 구분하여 사용합니다. 사실 이러한 구분은 약간의 차이가 있지만 대부분의 프로그램언어에서 공통으로 사용하는 특성입니다. 파이썬에서 수치형을 구분하는 방식은 표 1과 같습니다.

표 1 숫자형과 진수의 표기
항목
십진수정수(int)0, 2, -3, 123
실수(부동소수, float)0.754, 3.4E10
복소수(complex)0+2j, 10-3j
2진수(접두어로 'b' 사용)b01, b0110
8진수(접두어로 '0o' 사용)0o34, 0o25
16진수(접두어로 '0x' 사용)0x2A, 0xFF

정수와 실수는 알려진 용어입니다. 복소수 역시 학교 수학시간에 많이 접하는 용어이지만 실생활에 쉽게 사용되는 종류는 아닙니다(복소수 참조).

컴퓨터가 구사하는 언어의 기본 틀은 0과 1 두 가지입니다. 이것은 컴퓨터 메모리의 가장 기본단위인 비트(bit)의 활성(1)과 비활성(0)의 방법으로 표현하기 때문입니다. 그러므로 모든 데이터를 두 종류로 표현해야 합니다. 컴퓨터의 용량이 커지면서 기본 저장단위를 1바이트(byte, 8비트), 2바이트(16비트)로 확장되고 있습니다. 이 체계에서 사용하기 위해 입력되는 수를 8진수, 16진수로 변환하여 사용할 수 있습니다. 컴퓨터에서 정수, 실수 그리고 복소수를 저장하고 표현하는 자세한 방식은 "컴퓨터에서 숫자를 다루는 방식"을 참조합니다.

일상적으로 사용되는 10진수를 2진수등 다른 진수의 형태로 확인해야 하는 경우가 존재합니다. 파이썬은 숫자 포맷간의 변환 결과를 반환하는 다양한 내장 함수들을 제공합니다. 이에 대해 7 절에서 소개합니다.

지수승(거듭제곱)연산

수의 거듭제곱은 연산자 **를 사용합니다.

2**4
16
4**(1/2)
2.0
4**(1/2.0)
2.0
int(1/2.0)
0
4**(int(1/2.0)) ②
1

위 결과에서 코드 ②는 내장함수 int()를 사용하여 실수를 정수로 변환의 경우입니다. 즉, 1/2.0은 0.5이지만 이를 정수로 변환할 경우 0이 됩니다. 그러므로 결과는 4**0이 됩니다.

거듭제곱은 연산자 ** 대신 내장함수인 pow()를 적용할 수 있습니다.

pow(2, 4)
16
pow(4, 0.5)
2.0

파이썬 뿐만 아니라 대부분의 컴퓨터 언어에서는 연산의 순서는 다음이 적용됩니다.

괄호 > 지수승 > 곱셈 > 나눗셈 > 덧셈, 뺄셈

5+5*3
20
(5+5)*3
30

다음 코드 ③과 ④의 연산 결과는 다른 연산에서 사용할 수 없습니다. 그에 반해 코드 ⑤의 경우는 결과를 a라는 이름에 저장하였으므로 다음에 이 대상(객체)를 사용할 수 있는 것입니다. 즉, 어떤 결과를 재사용하기 위해서는 코드 ⑤와 같이 객체화(objectification)하여야 합니다.

3+4 ③
7
(3+4)*5 ④
35
a=3+4 ⑤
a*5
35

정수와 실수

표 1에서 나타낸 것과 같이 파이썬에서 수는 정수(integer)와 부동소수(실수, float) 그리고 복소수(complex)로 구분합니다. 다시말하면 각각은 int class, float class, 그리고 complex class내에서만 작동합니다.

print(type(5))
<class 'int'>
print(type(5.3))
<class 'float'>
print(type(5+3j))
<class 'complex'>

type()은 객체의 자료형을 반환합니다.

자료형은 클래스로 작성되었기 때문에 각각은 고유한 속성과 작동 영역을 가집니다(자료형(type)의 분류 참조). 숫자형에서 정수, 실수, 그리고 복소수 역시 각각에 대응하는 클래스로부터 생성되는 객체입니다. 이것은 같은 형태 사이에서만 연산이 이루어짐을 의미합니다. 예를 들면 int 클래스에서 작성된 객체는 같은 int 클래스의 객체(정수)들과의 연산에 한정됨을 의미합니다. 그러므로 원칙적으로 정수와 실수는 다른 클래스로 생성된 객체이므로 연산되지 않지만 다음 코드와 같이 실수형인 결과를 반환합니다.

a=3
b=3.0
type(a), type(b)
(int, float)
c=a+b
c
6.0
type(c)
float

위 코드와 같이 정수와 실수의 연산에서 정수는 암묵적으로 실수형으로 변환됩니다. 즉, 수치형들의 상이한 자료형들 사이에 연산은 더 큰메모리를 필요로 하는 형태로 자동적으로 변환됩니다. 예를 들어 실수는 정수보다 큰 메모리가 필요하므로 모두 실수로 변환되어 연산됩니다. 그러나 다음 코드와 같이 완전히 다른 형태인 문자와 수치와의 연산은 이루어지지 않습니다. 이것은 문자와 수치를 입력할 때 각각의 자료형이 고정된 상태이기 때문입니다.

type("a")
str
a+"a"
TypeError: unsupported operand type(s) for +: 'int' and 'str'

위 코드 객체 a는 정수 3이 할당된 것으로 자료형은 int인데 반해 큰따옴표와 함께하는 "a"의 자료형은 문자열(string)입니다. 파이썬에서는 작은 따옴표 또는 큰 따옴표로 묶인 형태의 자료는 모두 문자(열)로 인식합니다.

반올림

반올림은 내장함수인 round(x, ndigit=None)을 적용합니다. 반올림은 10-(ndigit+1)에 위치한 수에서 실행합니다.

round(1.53, 1)
1.5

다음 코드의 ndigit은 -1이므로 반올림 대상 위치는 10-(-1+1), 즉, 1의 자리입니다.

round(123.53, -1)
120.0
round(1.3325, 3)
1.333

분수(Fraction) 표현

파이썬의 모듈인 fractions의 함수 Fraction(실수) 사용하여 분수를 나타낼 수 있습니다. 이 모듈은 모두 정수인 분자(numerator)와 분모(denominator)를 튜플 형식으로 반환합니다.

import fractions
fractions.Fraction(1.5)
Fraction(3, 2)
fractions.Fraction(0.2)
Fraction(3602879701896397, 18014398509481984)
fractions.Fraction(0.3) 
Fraction(5404319552844595, 18014398509481984)

위 코드들의 0.2와 0.3는 부동소수의 문제를 가집니다(컴퓨터에서 숫자를 다루는 방식 참조). 즉, 분수로 나타낼 경우 분모를 2진수로 나타낼 수 없습니다. 그러므로 2진수로의 변환은 근사치이므로 예상치 못한 결과가 반환됩니다. 이 경우 인수를 문자열로 전달하는 것은 하나의 해결방법이 됩니다.

fractions.Fraction('0.2')
Fraction(1, 5)
fractions.Fraction('1.1')
Fraction(11, 10)

위 결과들의 표현은 분수의 형태가 아닙니다. 대신에 수학에 특화된 파이썬 패키지인 sympy의 Rational()함수를 사용하면 정확히 분수의 형태로 결과를 나타낼 수 있습니다.

from sympy import *
Rational(3,2)

$\frac{3}{2}$

Rational('3/2')

$\frac{3}{2}$

Rational(1.5)

$\frac{3}{2}$

Rational('0.2')

$\frac{1}{5}$

두 패키지로 나타낸 분수의 연산이 실행됩니다.

fractions.Fraction(1, 3)+fractions.Fraction("3/2")
Fraction(11, 6)
Rational(1,3)+Rational(3/2)

$\frac{11}{6}$

복소수(complex number)

복소수는 실수부와 허수부가 복합되어 나타나는 형태로 허수부 표시로 수학에서는 i를 사용하는데 반해 파이썬에서는 j를 사용합니다. 즉, 2 + 3j와 같이 나타내고 2를 실수부, 3을 허수부라고 합니다. 허수인 j를 사용하여 복소수를 정의할 수 있지만 내장 함수인 complex()를 사용하여 복소수를 생성 할 수 도 있습니다.

cpl=3+5j
cpl
(3+5j)
type(cpl)
complex
cpl1=complex(3, 5)
cpl1
(3+5j)
type(cpl1)
complex

복소수의 사칙연산은 다음과 같이 이루어지지만 정수와 실수에서 사용되는 나머지 연산(%), 몫 연산(//)은 성립되지 않습니다.

a=complex(2, 3)
b=complex(4,2)
a+b
(6+5j)
a-b
(-2+1j)
a*b
(2+16j)
a/b
(0.7+0.4j)
a//b
TypeError: can't take floor of complex number.
a%b
TypeError: unsupported operand type(s) for %: 'complex' and 'complex'

복소수의 실수부와 허수부는 각각 속성 real, imag로 나타낼 수 있고 켤레복소수는 conjugate() 메소드로 계산됩니다.

클래스(class)에서 생성되는 객체는 그 클래스의 모든 내용을 상속 받습니다. 내용은 클래스의 특성을 나타내는 속성(attribute)과 그 내부에서만 작동하는 함수인 메소드(method)를 의미합니다. 다음 코드에서 사용한 .real와 .imag는 클래스Complex의 속성이며 .conjugate()는 메소드입니다.

a
(2+3j)
a.real
2.0
a.imag
3.0
a.conjugate()
(2-3j)

복소수의 크기는 다음과 같이 계산됩니다.

(a.real**2+a.imag**2)**0.5
3.605551275463989

위의 계산은 절대값을 계산하는 파이썬의 내장함수 abs()로 계산됩니다.

abs(a)
3.605551275463989

댓글

이 블로그의 인기 게시물

[python] 이스케이프 문자(escape character)

Escape sequence 문자열을 작성할 경우 여러 상황에 사용되는 특수문자가 존재합니다. 예를 들어 문자열에 대화의 문구를 사용할 경우 따옴표를 표시할 수 없습니다. 문자열 자체가 따옴표로 처리되므로 따옴표 본래의 표시는 사용할 수 없기 때문입니다. 이러한 경우 세개의 따옴표(''' ''', 또는 """ """) 또는 역슬래시("\")를 사용하여 나타낼 수 있습니다. print("He said, "What's there?") SyntaxError: invalid syntax print('''He said, "What's there?"''') He said, "What's there?" print("""He said, "What's there?" """) He said, "What's there?" print("He said, \"What's there?\" ") He said, "What's there?" 위 결과와 같이 역슬래시를 사용하여 각 기호 본래의 의미를 나타낼 수 있습니다. 이렇게 어떤 상황을 지정하여 사용되는 기호나 문자들을 이스케이프 문자(escape character) 라고 합니다. 표 1은 일반적으로 사용하는 이스케이프 문자를 나타낸 것입니다. 표 1 이스케이프 문자 Escape 설명 \ 이스케이프 문자임을 나타내기 위해 사용 백슬레시를 나타냄 (\) \', \" 작은 따옴표와 큰 따옴표 \a 벨, 경고음 등을 나타낼 때 사용됨 \b 백스페이스 ...

[python] 모듈(Module), 패키지(Package)

모듈(Module), 패키지(Package) 프로그램 중 실행가능한 일정한 부분을 그룹화할 수 있습니다. 즉, 그 부분에 이름을 부여하여 객체로 만들어 동일한 작업이 필요할 경우마다 그 객체를 참조하여 사용할 수 있습니다. 그러므로 그 분리된 객체 자체가 프로그램이 되며 모듈(Module) 이라고 합니다. 동일한 자료형을 사용하는 여러개의 모듈을 하나의 디렉터리내로 묶을 필요가 있습니다. 이것을 패키지(package) 라고 합니다. 파이썬에서 사용할 수 있는 다양한 패키지의 존재하며 계속 생성되고 업데이트되고 있습니다. 이와 같이 큰 프로그램을 모듈화하여 사용하는 것은 프로그램의 실행과 수정, 복구 등 다양한 측면에서 유리합니다. 모듈(Module) 객체 정의(definition)와 문(statement)을 포함하는 파일 파이썬에서 생성하는 모듈의 확장명은 .py입니다. 프로그램을 실행 가능한 부분들의 조합으로 작성하기 위해 사용 모듈 전체 또는 일부를 다른 모듈, 프로그램 또는 인터프리터에서 호출하여 사용할 수 있습니다. 예를 들어 객체를 작성하여 확장자 " .py " 형식으로 별도의 파일에 저장한다면 모듈이 됩니다. 모듈/패키지의 import " 임포트(import) "는 파이썬을 작성하고 실행하는 코드 해석기(interpreter)에 모듈을 장착하는 명령 키워드입니다. 다음은 두 수를 더하는 사용자 정의 함수로 별도의 파일(test.py)에 저장된 것입니다. 이 함수는 파이썬 인터프리터의 모든 영역에서 사용할 수 있습니다. 그러나 파이썬 자체를 종결한 후 생성한 함수도 소멸되므로 추후에 사용하기 위해 별도의 파일로 저장합니다. 이렇게 저장된 파이썬 파일이 모듈이 됩니다. def add(a, b): return a+b 위 파일을 모듈로 사용하기 위해 실행파일에서 test.py를 임포트 합니다. 임포트 된 모듈의 함수를 사용하는 경우 식 1과 같이 그 함수의 모듈...