기본 콘텐츠로 건너뛰기

[python] 파일 운용(File Operation)

파일 운용(File Operation) 파일 열기/생성 파일에 쓰기 파일 내용 읽기 파이썬 인터프리터에서 실행한 여러 작업들은 컴퓨터 주기억장치인 RAM(random access memory)에 저장됩니다. 이 저장소는 인터프리터가 종료되면 함께 RAM에 저장된 작업과정이나 결과가 휘발되므로 영구적으로 저장되는 하드디스크에 그 작업을 저장할 필요가 있습니다. 이 과정은 표 1의 함수 또는 메소드를 순차적으로 적용하여 실행할 수 있습니다. 표 1 파일 운용을 위한 함수 순서 함수/메소드 내용 1 open() 파일 열기, 함수 2 write() 쓰기(입력) , 메소드 2 read() 읽기 , 메소드 3 close() 파일 닫기, 메소드 파일 열기/생성 파일을 호출 또는 새로운 파일을 생성하기 위해 내장함수인 open() 을 사용할 수 있습니다. 이 함수는 파일의 경로와 그 파일을 처리하는 방식을 지정합니다. 파일의 처리방식은 표 2에 소개한 것과 같이 다양합니다. 표 2 open() 함수의 mode 종류 mode 의  미 'r' 읽기전용(기본값) 'w' 쓰기 전용, 파일이 존재하지 않으면 새로운 파일이 생성되고 파일이 존재한다면 이전 내용은 지워집니다. 'x' 파일 생성, 파일이 존재한다면 에러발생 'a' 파일의 기존 내용의 끝에 첨가되고 파일이 존재하지 않는 경우 새 파일이 생성 't' 파일을 text 모드로 엽니다(기본). 'b' 파일을 이진모드로 엽니다. '+' 파일을 업데이트하기 위해 오픈합니다. 사용방식은 r 과 w를 모두 사용합니다. open() 함수 사용 후 결과를 저장을 위해서는 인터프리터에서 그 객체(결과)를...

[python] 컴퓨터에서 숫자를 다루는 방식

컴퓨터에서 숫자를 다루는 방식

사용자가 입력한 값은 컴퓨터 저장 장치에 비트(bit) 단위로 1 또는 0으로 저장됩니다. 결과적으로 컴퓨터 연산은 2진수로 이루어집니다.

정수의 표현방식

다음 식은 컴퓨터에서 5를 저장하거나 연산하기 위해 이진수로 변환한 것입니다.

5 = 1 × 22 + 0 × 21 + 1 × 20

위와 같이 십진수 5는 이진수 101로 변환되며 그 이진수 값은 다음과 같이 아래첨자로 진수를 표현합니다. 일반적으로 십진수에 대한 아래첨자는 생략됩니다.

5(10) = 101(2)

1 비트로 표현할 수 있는 수는 0 또는 1이므로 비트수에 대한 표현 용량은 다음과 같이 계산됩니다.

c = 2n,  c: Capacity, n: 비트수

그러므로 8비트에서의 표현할 수 있는 수는 다음과 같이 256이므로 0 ~ 255까지 나타낼 수 있습니다.

2**8
256

정수인 경우는 음과 양의 사인(sign)을 저장하기 위해 최왼쪽의 1비트가 예약되므로 숫자는 최대 7비트를 사용할 수 있습니다. 양수를 0 음수를 1로 처리합니다. 그러므로 수를 저장하기 위한 비트는 7개로 양수의 최대값은 0111111(2)이 됩니다. 이는 127(10)이 됩니다.

컴퓨터에서 음수를 직접적으로 표현할 수 없기 때문에 부호 비트를 지정하여 양수에 대한 음수는 2의 보수(tow's complement)를 사용하여 나타낼 수 있습니다.

일정한 비트수를 기준으로 이진수로 변환할 수 있는 십진수의 범위는 다음과 같이 계산할 수 있습니다.

-2n-1 ~ 2n-1 - 1, n: 비트수

십진수 정수를 2진수로 전환하기 위해 내장함수 int(), bin()을 적용합니다.

int('0b01111111', 2)
127
int('0b10000000', 2)
128
bin(-128)
'-0b10000000'
bin(127)
'0b1111111'

위 결과와 같이 8비트에서 저장될 수 있는 정수의 -128 ~ 127입니다. 이와 같이 16, 32, 64비트에서의 정수의 범위를 계산해 보면 다음과 같습니다.

bit=[8, 16, 32, 64]
for i in bit:
    print(f'{i} 비트: [-{2**(i-1)}, {2**(i-1)-1}]')
8 비트: [-128, 127]
16 비트: [-32768, 32767]
32 비트: [-2147483648, 2147483647]
64 비트: [-9223372036854775808, 9223372036854775807]

위 코드에서는 동일한 명령(코드)를 반복할 수 있는 반복문중의 하나인 for 문을 사용한 것입니다(반복문 참조).

C 등의 프로그래밍 언어에서는 정수를 long, long long 형으로 선언하여 32 비트, 64 비트 등으로 구분하지만 파이썬 3.0 부터는 가변비트 수를 사용하기 때문에 구분없이 선언할 수 있습니다.

파이썬에서 정수형은 int 클래스에 속하는 자료형입니다.

print(type(3))
<class 'int'>

선언한 정수의 비트수를 확인하기 위해서는 sys 모듈의 getsizeof()함수를 사용합니다. 이 함수는 바이트(byte) 단위로 반환합니다. 1바이트는 8비트를 나타냅니다.

import sys
x=0
sys.getsizeof(x)
28
bin(x)
'0b0'

사실 0을 이진수로 변환하기 위한 것은 1 비트 만이 필요하지만 파이썬에서 사용하는 용량은 28바이트입니다. 즉, 이 용량은 정수를 처리하기 위해 기본적으로 사용하는 메모리 크기로 간주할 수 있습니다. 물론 사용자의 컴퓨터 사양에 따라 이 값은 달라질 것입니다.

sys.getsizeof(-2596148429267413814265248164610047)
40

부동소수점(float), 실수의 표현

파이썬의 내장 클래스인 float 클래스를 사용하는 것으로 실수를 나타냅니다. 실수는 IEEE 754(국제표준)에 따라 다음과 같이 유효숫자와 정수화된 지수(exponent)의 곱으로 표현합니다.

1.25 = 125 × 10-2 = 125e-2
실수 = 유효숫자 × 10지수

유효숫자(significant digit)는 수의 정확도에 영향을 주는 숫자로 위의 경우는 숫자의 앞부분과 뒷부분의 0을 제외한 부분을 나타냅니다. 다음 코드의 숫자들은 모두 유효숫자가 3입니다.

125e2
 12500.0
125e-2
1.25
1.25e-0
1.25

파이썬은 부동소수점 실수를 8 바이트 또는 64 비트 기준으로 부호와 지수(정수) 그리고 유효숫자에 고정된 비트에 할당하여 이진수로 전환합니다. 다음은 64비트를 기준으로 부호, 지수, 그리고 유효숫자를 할당한 경우입니다.

  • 부호를 위해 1비트 할당
  • 지수(정수)를 위해 11비트 할당, 그 범위는 [-1024, 1023]
  • 유효숫자를 위해 52비트 할당
rightEx=bin(1023); rightEx
'0b1111111111'
leftEx=bin(-1024); leftEx
'-0b10000000000'

예를 들어 십진수 1.25을 이진수로 나타내면 다음과 같습니다.

1.2510 = (1 × 20 + 0 × 2-1 + 1 × 2-2)10 = (1.01)2

실수의 소수점이하 수는 다음 과정에 의해 2진수로 변환할 수 있습니다.

  1. 2를 곱한 결과 중 소수점 이상이 되는 수를 선택
  2. 과정1은 소수점 이하의 값이 0이 될때까지 반복
  3. 각 반복에서 소수점 이상의 값이 이진값이 됩니다.

예를 들어 0.25를 적용하여 봅니다.

0.25 × 2 = 0.5 → 0
0.5 × 2 = 1 → 1
∴ 0.012

모든 부동소수가 2진수로 전환되지는 않습니다. 이것은 수치연산에서 예상하지 않은 결과가 도출되는 이유이기도 합니다. 이를 살펴보기 위해 위 변환과정을 수행하는 사용자정의함수 float2bin()를 작성하여 사용하였습니다.

def float2bin(x, n=10):
    x1=x
    re=[]
    for i in range(n):
        x1=x1*2
        re.append(int(x1))
        if (x1-int(x1))==0:
            break
        x1=x1-int(x1)
    re=''.join(str(i) for i in re)
    return('0.'+re) 
a=[0.5, 0.25, 0.125, 0.375]
[float2bin(i) for i in a]
['0.1', '0.01', '0.001', '0.011']

이 함수를 적용하여 십진수 0.1을 이진수로 전환할 경우 유효숫자를 지정할 수 없습니다. 그러므로 이진수로 변환할 수 없습니다.

float2bin(0.1, n=100)
'0.0001100110011001100110011001100110011001100110011001101'

다음 코드와 같이 이진수로 완전한 전환이 어려운 실수의 경우 연산은 예측과 다른 결과를 반환하기도 합니다.

a=0.3
b=(0.1+0.2)
a == b
False

이러한 차이로 발생되는 오류는 반올림 등으로 수정될 수 있습니다.

round(a, 3)==round(b, 3)
True

위에서 적용한 round() 함수 외에 math.isclose()를 사용하여 두 값을 비교할 수 있습니다.

from math import isclose
isclose(a, b, rel_tol=1e-9, abs_tol=0.0)
True

또한 decimal 클래스를 사용하여 정밀도를 제안함으로서 0.1과 같이 정확한 이진수로 변환할 수 없는 부동소수점에서 파생되는 문제를 다룰수 있습니다.

x=0.1
x+x+x
0.30000000000000004
import decimal 
from decimal import Decimal 
y=Decimal('0.1')
y+y+y
Decimal('0.3')

decimal 클래스는 표현된 십진수의 수를 그대로 사용하므로 일반적으로 예상된 결과를 생성합니다.

3*x-0.1
0.20000000000000004
3*y-Decimal('0.1')
Decimal('0.2')

Decimal 클래스는 산술연산 과정에서 정밀도와 반올림 알고리즘을 제어하는 컨텍스트 관리자(context manager)(with 문과 컨텍스트 관리자 참조)와 연결되기 때문입니다. 즉, 이 클래스는 __enter__()와 __exit__()의 내장메서드를 포함합니다. 그러므로 이 클래스에 전달되는 인수(실수)는 자동으로 정해진 정밀도를 기준으로 반올림 됩니다.

숫자형의 표현범위

파이썬에서 숫자형은 각 자료형에 따라 저장 용량이 결정됩니다. sys 모듈의 속성 maxsize, maxsize-1으로 정수형의 최대와 최소값, 그리고 float_inf를 적용하여 실수(부동소수점)형의 정보를 확인할 수 있습니다.

import sys
sys.maxsize #정수형 최대값
9223372036854775807
-sys.maxsize-1 #정수형 최소값
-9223372036854775808
sys.float_info  #실수형의 정보
sys.float_info(max=1.7976931348623157e+308, max_exp=1024, max_10_exp=308, min=2.2250738585072014e-308, min_exp=-1021, min_10_exp=-307, dig=15, mant_dig=53, epsilon=2.220446049250313e-16, radix=2, rounds=1)

위 실수형의 결과 중 "dig = 15"는 소수점 이하 15자리까지가 정확하다는 의미입니다.

댓글

이 블로그의 인기 게시물

[python] 이스케이프 문자(escape character)

Escape sequence 문자열을 작성할 경우 여러 상황에 사용되는 특수문자가 존재합니다. 예를 들어 문자열에 대화의 문구를 사용할 경우 따옴표를 표시할 수 없습니다. 문자열 자체가 따옴표로 처리되므로 따옴표 본래의 표시는 사용할 수 없기 때문입니다. 이러한 경우 세개의 따옴표(''' ''', 또는 """ """) 또는 역슬래시("\")를 사용하여 나타낼 수 있습니다. print("He said, "What's there?") SyntaxError: invalid syntax print('''He said, "What's there?"''') He said, "What's there?" print("""He said, "What's there?" """) He said, "What's there?" print("He said, \"What's there?\" ") He said, "What's there?" 위 결과와 같이 역슬래시를 사용하여 각 기호 본래의 의미를 나타낼 수 있습니다. 이렇게 어떤 상황을 지정하여 사용되는 기호나 문자들을 이스케이프 문자(escape character) 라고 합니다. 표 1은 일반적으로 사용하는 이스케이프 문자를 나타낸 것입니다. 표 1 이스케이프 문자 Escape 설명 \ 이스케이프 문자임을 나타내기 위해 사용 백슬레시를 나타냄 (\) \', \" 작은 따옴표와 큰 따옴표 \a 벨, 경고음 등을 나타낼 때 사용됨 \b 백스페이스 ...

[python] 숫자형(number typer)

숫자형 (Number type) 기본 연산 지수승(거듭제곱)연산 정수와 실수 반올림 분수(Fraction) 표현 복소수(complex number) 형변환 진수변환 기본 연산 파이썬은 마치 계산기와 같이 적합한 식을 전달하는 것에 의해 계산을 할 수 있습니다. 그러므로 그 자체로 훌륭한 계산기로 사용할 수 있습니다. 기본적인 계산을 위해 사용되는 연산자는 일반 수학이나 계산기에서 사용되는 것과 같습니다. 즉, 더하기, 빼기, 곱하기 그리고 나누기 연산자는 각각 +, -, * 그리고 / 기호를 사용합니다. 1+2 3 0.9+0.231 1.131 100-27 73 -2.4-0.9 -3.3 3*2 6 3.45*0.12 0.414 3/2 1.5 4.23/1.27 ① 3.330708661417323 나누기 연산에서는 일반 계산기와 다르게 특이한 연산자를 사용할 수 있습니다. 위 코드 ①의 답 3.33…과 같은 실수인 경우 // 와 % 연산자를 사용하여 몫과 나머지로 표현할 수 있습니다( 산술연산자 참조 ) 4.23//1.27 3.0 4.23%1.27 0.4200000000000004 위 경우는 실수를 실수로 나눈 것으로 정수에 적용해 봅니다. 5/3 1.6666666666666667 5//3 1 5%3 2 위 코드의 5를 3으로 나눈 경우 실수가 반환됩니다. 실수 중에 몫은 정수부분이 되지만 나머지는 이 결과의 소수부분과는 다릅니다. 즉, //, % 연산자에 의한 결과는 모두 정수로 표현됩니다. 위 정수와 정수의 나눗셈의 결과는 실수이며 몫은 정수입니다. 이 경우 실수를 정수로 변환하면 정수인 몫을 나타낼 수 있습니다. 실수를 정수로 변환하기 위해 내장함수인 int() 를 적용합니다. int(5/3) 1 파이썬에서는 수를 일정한 형식으로 구분하여 사용합니다. 사실 이러한 구분은 약간의 차이가 있지만 대부분의 프로그램언어에서 공통으로 사용하는 특성입니다. 파이썬...

[python] 모듈(Module), 패키지(Package)

모듈(Module), 패키지(Package) 프로그램 중 실행가능한 일정한 부분을 그룹화할 수 있습니다. 즉, 그 부분에 이름을 부여하여 객체로 만들어 동일한 작업이 필요할 경우마다 그 객체를 참조하여 사용할 수 있습니다. 그러므로 그 분리된 객체 자체가 프로그램이 되며 모듈(Module) 이라고 합니다. 동일한 자료형을 사용하는 여러개의 모듈을 하나의 디렉터리내로 묶을 필요가 있습니다. 이것을 패키지(package) 라고 합니다. 파이썬에서 사용할 수 있는 다양한 패키지의 존재하며 계속 생성되고 업데이트되고 있습니다. 이와 같이 큰 프로그램을 모듈화하여 사용하는 것은 프로그램의 실행과 수정, 복구 등 다양한 측면에서 유리합니다. 모듈(Module) 객체 정의(definition)와 문(statement)을 포함하는 파일 파이썬에서 생성하는 모듈의 확장명은 .py입니다. 프로그램을 실행 가능한 부분들의 조합으로 작성하기 위해 사용 모듈 전체 또는 일부를 다른 모듈, 프로그램 또는 인터프리터에서 호출하여 사용할 수 있습니다. 예를 들어 객체를 작성하여 확장자 " .py " 형식으로 별도의 파일에 저장한다면 모듈이 됩니다. 모듈/패키지의 import " 임포트(import) "는 파이썬을 작성하고 실행하는 코드 해석기(interpreter)에 모듈을 장착하는 명령 키워드입니다. 다음은 두 수를 더하는 사용자 정의 함수로 별도의 파일(test.py)에 저장된 것입니다. 이 함수는 파이썬 인터프리터의 모든 영역에서 사용할 수 있습니다. 그러나 파이썬 자체를 종결한 후 생성한 함수도 소멸되므로 추후에 사용하기 위해 별도의 파일로 저장합니다. 이렇게 저장된 파이썬 파일이 모듈이 됩니다. def add(a, b): return a+b 위 파일을 모듈로 사용하기 위해 실행파일에서 test.py를 임포트 합니다. 임포트 된 모듈의 함수를 사용하는 경우 식 1과 같이 그 함수의 모듈...