튜플 활용

주요 내용

파이썬에 내장되어 있는 컬렉션 자료형 중에서 튜플에 대해 알아 본다.

튜플(tuples): 리스트와 비슷. 하지만 수정 불가능(immutable).

  • 사용 형태: 소괄호 사용

    even_numbers_tuple = (2, 4, 6, 8, 10)
    todays_datatypes_tuple = ('list', 'tuple', 'dictionary')
  • 특징: 임의의 자료형 값들을 섞어서 항목으로 사용 가능

    mixed_tuple = (1, 'abs', [2.1, 4.5])
  • 인덱스 또는 슬라이싱을 이용하여 각각의 항목에 또는 여러 개의 항목에 대한 정보를 활용할 수 있다. 사용법은 문자열의 경우와 동일.

  • 튜플은 수정 불가능하다. 즉, 불변 자료형이다.

  • 튜플 자료형은 불변 자료형이라서 메소드가 별로 없다. 많이 사용되는 두 개이다.

    • count(): 튜플에 포함된 특정 항목이 몇 번 나타나는지 세어 줌.
    • index(): 특정 항목의 인덱스가 몇 번인지 확인해 줌.

오늘의 주요 예제

Byun_Sato.txt 파일에는 변사또 학생의 개인 신상정보가 아래와 같이 들어 있다.

# 학생들의 중요 개인정보이며, 배포 금지함.

Name:   Byun Sato
Date of Birth:  95.4.28
Email:  SatoByun@hknu.ac.kr
Department: Computer
Student ID: 201700251003

파일의 내용을 읽어서 아래와 같은 형식으로 리턴하는 함수를 구현하고자 한다.

{'Date of Birth': (1995, 4, 28),
 'Department': 'Computer',
 'Email': 'SatoByun@hknu.ac.kr',
 'Name': 'Byun Sato',
 'Student ID': '201700251003'}

튜플의 기본 활용

오늘의 주요 예제의 문제를 해결하려면, 문자열과 사전 자료형과 더불어 튜플에 대해 알아 보아야 한다. 튜플은 순서쌍이라고도 불리며, 리스트와 99% 비슷한 용도를 가진다. 리스트와 다른 점은 튜플이 불변 자료형이라는 것 뿐이다. 물론, 튜플이 불변 자료형이기에 리스트 자료형이 갖고 있는 다양한 메소드를 갖지 못한다.

In [1]:
t = (3, 50, "yellow")
print(t)
In [2]:
type(t)
In [3]:
l = [3, 50, "yellow"]
l
In [4]:
type(l)

튜플의 경우 인덱싱과 슬라이싱은 문자열 또는 리스트에서의 활용과 100% 동일

In [5]:
t[1]
In [6]:
t[-1]
In [7]:
t[:2]
In [8]:
t[: : 2]

튜플을 사용할 때 소괄호를 생략해도 된다. 하지만 기본적으로 소괄호를 사용한다.

In [9]:
a = 10, 20, 30
type(a)
Out[9]:
tuple
In [10]:
print(a)
(10, 20, 30)

튜플은 불변 자료형이다.

리스트와는 달리 인덱싱을 사용하여 튜플 특정 원소의 값을 변경할 수 없다.

In [11]:
t[1] = 5
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-11-e9323da3946c> in <module>()
----> 1 t[1] = 5

TypeError: 'tuple' object does not support item assignment

튜플 자료형 활용 예제 1

  • 절대로 변경되지 않거나 변경되어서는 안되는 값들을 저장할 때 사용
    • 예를 들어, 생년월일, 학과 전공 등등.
In [12]:
So_Ritgun_dob = (1996, 12, 16)

튜플 자료형 활용 예제 2

  • 여러 개의 변수들에 여러 개의 값들을 한 줄에 동시에 할당하기 위해 사용
In [13]:
a, b = 1, 2
In [14]:
a
Out[14]:
1

튜플을 이용하면 두 변수에 할당된 값을 스왑(swap)하는 것이 매우 간단하다.

In [15]:
a, b = b, a
In [16]:
a
Out[16]:
2

주의: C, C#, Java 등에서 앞서의 예제와 같은 스왑기능을 구현하려면 포인터를 사용해야 한다.

튜플 자료형 활용 예제 3

  • 여러 개의 값들을 리턴하는 함수를 정의할 때 사용

함수의 리턴값은 무조건 하나이다. 예를 들어, 2를 입력 받아서 2의 제곱과 2의 세제곱을 동시에 리턴하는 함수는 정의할 수 없다. 하지만, 두 개의 값을 튜플로 묶어서 하나의 값으로 리턴할 수는 있다.

아래 함수는 입력받은 값의 제곱과 세제곱을 튜플로 묶어서 리턴한다.

주의: 소괄호 기호는 생략이 가능하다는 것에 주의한다.

In [17]:
def f(x):
    return x**2, x**3

이제 아래와 같이 리턴값 각각의 항목에 변수를 할당하여 사용할 수 있다.

In [18]:
a, b = f(2)
In [19]:
a
Out[19]:
4

불변성(immutability)대 가변성(mutability)

튜플과 문자열은 불변성 자료형이다. 즉, 이미 생성된 값들을 절대 수정할 수 없다.

예를 들어, 아래와 같이 튜플의 특정 항목을 대체하려거나 문자열의 일부를 다른 문자열로 대체하려는 시도는 오류를 발생시킨다.

In [20]:
a = ('Hello', 'World')
a[0] = 'Hi'
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-20-155a99192be8> in <module>()
      1 a = ('Hello', 'World')
----> 2 a[0] = 'Hi'

TypeError: 'tuple' object does not support item assignment
In [21]:
a = ('Hello', 'World')
a[1][0] = 'w'
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-21-a63d8388a298> in <module>()
      1 a = ('Hello', 'World')
----> 2 a[1][0] = 'w'

TypeError: 'str' object does not support item assignment

만약에 튜플의 특정 항목 또는 문자열의 일부를 다른 문자열로 대체하고 싶다면, 기존의 값들을 이용하여 새로운 튜플과 문자열을 생성해야 한다.

In [22]:
b = ('Hi', a[1])
b
Out[22]:
('Hi', 'World')
In [23]:
b = ('Hi',) + (a[1],)
b
Out[23]:
('Hi', 'World')

주의: 길이가 1인 튜플에는 반드시 콤마를 사용해야 한다. 그렇지 않으면 튜플로 간주하지 않는다.

In [24]:
a = (a[0], 'w' + a[1][1:])
a
Out[24]:
('Hello', 'world')

비유해서 설명하면, 아파트가 문자열 또는 튜플 자료형이라면 아파트를 수선할 수는 없고, 대신에 기존 아파트를 부신 다음에 새로 원하는 대로 지어야 함을 의미한다.

튜플과 사전 활용 예제

튜플과 사전을 함께 활용하면 학생들의 신상정보 등을 저장할 때 유용하다. 예를 들어 '학생이름', '학번', '생일' 등을 키로 사용하고, 키값으로는 진짜 나이, 학번, 생일 등을 저장할 수 있다.

  • 아래 코드는 특정 디렉토리에 저장된 학생들의 신상정보 파일을 모두 읽어들여서 활용하는 프로그램을 위한 함수들을 구현하고 있다.
In [25]:
import glob
import string

먼저 std_record_list 함수는 지정된 디렉토리에 포함된 모든 학생들의 신상정보 파일명을 읽어드린다.

glob 모듈의 glob 함수의 활용을 기억해 두면 좋다.

In [26]:
def std_record_list(dir):
    """
    지정된 디렉토리에 포함된 모든 학생들의 신상정보 파일명을 읽어드림.
    
    입력값:
        디렉토리 이름 - 문자열 이용.
    리턴값:
        학생들 신상정보 파일이름으로 구성된 리스트
    """
    files = glob.glob(dir + '/*.txt')
    
    return sorted(files)

위 함수를 활용하여, 'data/Students_Record' 디렉토리에 있는 모든 파일들의 이름을 확인할 수 있다.

주의: glob() 함수의 리턴값은 해당 디렉토리에 저장된 파일을 임의의 순서대로 확인하여 리스트를 만든다. 따라서, 이름 순서대로 리스트를 얻기 위해서 sorted() 함수를 활용하였다.

In [27]:
filenames = std_record_list('data/Students_Records/')
filenames
Out[27]:
['data/Students_Records/Byun_Sato.txt',
 'data/Students_Records/Pi_Matgol.txt',
 'data/Students_Records/So_Ritgun.txt']
  • date_of_birth 함수는 생년월일 정보를 (년, 월, 일) 형식으로 변경하는 함수이다.
In [28]:
def date_of_birth(date_birth):
    '''
    생년월일 정보를 (년, 월, 일) 형식으로 변경하는 함수

    입력값:
        * 생년월일 정보 문자열 - "년.월.일"
    리턴값:
        * 생년월일 정보 튜플 - (년, 월, 일)
    '''
    year, month, day = date_birth.split('.')
    
    year = int(year) + 1900
    month = int(month)
    day = int(day)

    ymd = (year, month, day)
    
    return ymd
In [29]:
date_of_birth("2017.09.27")
Out[29]:
(3917, 9, 27)
  • record_getter 함수는 지정된 학생의 신상정보를 리스트에 담아 리턴한다. 리스트의 각각의 항목은 항목명과 항목내용으로 구성된 튜플들이다.
In [30]:
def record_getter(filename):
    '''
    지정된 학생의 신상정보를 리스트로 출력함.
    각 항목은 항목명과 내용의 튜플로 구성됨
    
    입력값:
        파일명을 가리키는 경로
    리턴값:
        학생들의 신상정보의 각 항목을 담은 리스트
    '''
    std_data = []
    a_file = open(filename, u"r")
    
    for line in a_file.readlines():
        if line[0] == '#' or line in string.whitespace:
            continue
        else:
            item, value = line.split(':')
            item = item.strip()
            value = value.strip()

            if item.strip() == 'Date of Birth':
                value = date_of_birth(value)
            std_data.append((item, value))
            
    return std_data

예를 들어 Byun_Sato 학생의 신상정보가 아래와 같이 확인된다.

In [31]:
record_getter('data/Students_Records/Byun_Sato.txt')
Out[31]:
[('Name', 'Byun Sato'),
 ('Date of Birth', (1995, 4, 28)),
 ('Email', 'SatoByun@hknu.ac.kr'),
 ('Department', 'Computer'),
 ('Student ID', '201700251003')]
  • 이제 위 코드를 한 군데 모아서 아래와 같이 각각의 학생의 정보를 얻을 수 있다. 아래 코드는 세 번째 학생의 정보를 확인한다.
In [32]:
filenames = std_record_list('data/Students_Records/')

So_data = record_getter(filenames[2])
So_data
Out[32]:
[('Name', 'So Ritgun'),
 ('Date of Birth', (1996, 12, 16)),
 ('Email', 'RitgunSo@hknu.ac.kr'),
 ('Department', 'Computer'),
 ('Student ID', '201600232039')]

정보를 확인할 때는 튜플보다 사전이 효율적이다.

위 코드는 학생들의 신상정보의 정리해서 잘 보여준다. 하지만 소속학과, 생년월일 등에 대한 구체적인 정보를 추출하는 일은 좀 번거롭다.

예를 들어, So Ritgun 학생의 소속학과를 확인하려면 다음과 같이 해야 한다.

In [33]:
for i in range( len(So_data) ):
    if So_data[i][0] == 'Department':
        print("전공은", So_data[i][1], "입니다.")
        break
전공은 Computer 입니다.

그런데 사전을 이용하면 보다 쉽게 할 수 있다.

먼저 So_data를 사전으로 만들어보자.

In [34]:
So_data_dict = {}
for i in range( len(So_data) ):
    So_data_dict[So_data[i][0]] = So_data[i][1]

So_data_dict
Out[34]:
{'Date of Birth': (1996, 12, 16),
 'Department': 'Computer',
 'Email': 'RitgunSo@hknu.ac.kr',
 'Name': 'So Ritgun',
 'Student ID': '201600232039'}

그러면 소속학과 또는 좋아하는 색깔 등을 확인하는 일이 매우 쉽다.

In [35]:
So_data_dict['Department']
Out[35]:
'Computer'
In [36]:
So_data_dict['Email']
Out[36]:
'RitgunSo@hknu.ac.kr'

주의: 하나의 항목의 키값을 변경하거나 새로운 (키, 값) 항목을 추가하려면 아래 형식을 이용한다.

사전이름[키] = 키값

반면에 여러 항목을 사전에 추가하려면 update() 메소드를 이용한다.

In [37]:
So_data_dict['Residence'] = 'Anseong'

So_data_dict
Out[37]:
{'Date of Birth': (1996, 12, 16),
 'Department': 'Computer',
 'Email': 'RitgunSo@hknu.ac.kr',
 'Name': 'So Ritgun',
 'Residence': 'Anseong',
 'Student ID': '201600232039'}

주의: 순서는 전혀 중요하지 않다.

In [38]:
So_data_dict.update({'Grade': '2', 'Semester': '2'})

So_data_dict
Out[38]:
{'Date of Birth': (1996, 12, 16),
 'Department': 'Computer',
 'Email': 'RitgunSo@hknu.ac.kr',
 'Grade': '2',
 'Name': 'So Ritgun',
 'Residence': 'Anseong',
 'Semester': '2',
 'Student ID': '201600232039'}

항목을 삭제하려면 del 함수 또는 pop() 메소드를 사용한다. 존재하지 않는 key를 이용할 경우 어떤 일이 일어나는지 확인하라.

In [39]:
del So_data_dict['Residence']

So_data_dict
Out[39]:
{'Date of Birth': (1996, 12, 16),
 'Department': 'Computer',
 'Email': 'RitgunSo@hknu.ac.kr',
 'Grade': '2',
 'Name': 'So Ritgun',
 'Semester': '2',
 'Student ID': '201600232039'}
In [40]:
print(So_data_dict.pop('Grade'))
2
In [41]:
print(So_data_dict.pop('Semester'))
2
In [42]:
So_data_dict
Out[42]:
{'Date of Birth': (1996, 12, 16),
 'Department': 'Computer',
 'Email': 'RitgunSo@hknu.ac.kr',
 'Name': 'So Ritgun',
 'Student ID': '201600232039'}
In [43]:
So_data_dict['Date of Birth']
Out[43]:
(1996, 12, 16)
In [44]:
So_data_dict['Name']
Out[44]:
'So Ritgun'
  • 이제 사전 자료형을 이용하여 record_getter 함수를 수정하자.
In [45]:
def record_getter(filename):
    '''
    지정된 학생의 신상정보를 리스트로 출력함.
    각 항목은 항목명과 내용의 튜플로 구성됨
    
    입력값:
        파일명을 가리키는 경로
    리턴값:
        학생들의 신상정보의 각 항목을 담은 사전 자료형
    '''
    std_data = {}
    a_file = open(filename, u"r")
    
    for line in a_file.readlines():
        if line[0] == '#' or line in string.whitespace:
            continue
        else:
            item, value = line.split(':')
            item = item.strip()
            value = value.strip()

            if item.strip() == 'Date of Birth':
                value = date_of_birth(value)
            std_data[item] = value
            
    return std_data
In [46]:
record_getter('data/Students_Records/Byun_Sato.txt')
Out[46]:
{'Date of Birth': (1995, 4, 28),
 'Department': 'Computer',
 'Email': 'SatoByun@hknu.ac.kr',
 'Name': 'Byun Sato',
 'Student ID': '201700251003'}
  • 아래 코드에서 all_records 변수에는 모든 학생의 신상정보를 리스트로 담고 있다. 각 항목은 각 학생의 신상정보를 담은 사전 자료형이다.
In [47]:
filenames = std_record_list('data/Students_Records/')

all_records = []
for file in filenames:
    data = record_getter(file)
    all_records.append(data)
    
all_records
Out[47]:
[{'Date of Birth': (1995, 4, 28),
  'Department': 'Computer',
  'Email': 'SatoByun@hknu.ac.kr',
  'Name': 'Byun Sato',
  'Student ID': '201700251003'},
 {'Date of Birth': (1995, 9, 8),
  'Department': 'Environment',
  'Email': 'MatgolPi@hknu.ac.kr',
  'Name': 'Pi Matgol',
  'Student ID': '201600213023'},
 {'Date of Birth': (1996, 12, 16),
  'Department': 'Computer',
  'Email': 'RitgunSo@hknu.ac.kr',
  'Name': 'So Ritgun',
  'Student ID': '201600232039'}]

이런 식으로 예를 들어 두 번째 학생이 소속학과를 다음처럼 확인 가능하다.

In [48]:
all_records[1]['Department']
Out[48]:
'Environment'

또는 첫 번째 학생의 이름을 확인한다.

In [49]:
all_records[0]['Name']
Out[49]:
'Byun Sato'

연습문제

연습

첫 번째 학생의 신상정보를 아래 형식으로 출력하는 코드를 작성하라.

제 이름은 ___이며, 나이는 ___살 입니다.

연습

전공이 Computer인 학생 이름의 리스트를 구하라.

연습

전공을 인자로 입력하면 해당 전공 학생들의 이름으로 구성된 리스트를 리턴하는 함수 faculty_member 함수를 구현하라.