C언어 샘플코드 - 파일입출력과 문자열 파싱

Posted by ironmask84
2017. 10. 17. 08:57 컴퓨터공학/C언어 레퍼런스



2년도 전에 타 블로거의 글을 참고해서 문자열함수에 대해 공유 드린적이 있었습니다.
( http://ironmask.net/198 )

내가 아닌 다른 분이  작성한 것을 참고하는 것은 역시 세월이 지나면,

참고할 때의 기억이 잘 안나는 것 같네요 ㅎㅎ

SW개발 업무를 맡고는 있지만 디버깅하는 업무가 많다보니,

코딩을 할 때 원하는 함수나 문법이 생각이 나지 않을 때가 종종 있습니다.

사실 다루는 프로그래밍 언어도 한 개에 국한되지 않으므로 더욱 혼잡함 ㅜㅜ

아무튼 그래서 기회되는 대로 샘플코드 형식으로 기록도 남기고,

방문자분들에게도 좋은 정보를 제공하도록 하겠습니다. :)


주제 요약 설명

C언어로 파일을 읽어와서

특정 키워드와 비교하는 조건문을 통해,

특정 delimiter로 파싱해서 결과물을 얻는 코드 입니다.

주요 사용 함수는 fopen, fgets, strncmp, strtok 입니다.

C언어의 기본 문법과 함수에 대한 사용법을 어느 정도 숙지하신 것을 

기본 전제로 진행합니다. ^^

샘플 코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
 
/*
Start 2017-10-10
By ironmask 
*/
 
int main( int argc, char* argv[] )
{
    
    char* token;
    char* token2;
    
    char strline[100];    // one line sentence
    int i = 0;
    char* word = "iface eth0 inet static"// keyword
    
    FILE *fp = fopen("../../etc/network/interfaces""r+");
    
    if(fp == NULL){
        puts("FAIL");
        return -1;
    }
    
    
    while(fgets(strline, sizeof(strline), fp)) // 한줄을 읽는데 size 만큼 읽는다.
    {     
        // interfaces File 내에 특정 키워드 찾기
        if(strncmp(strline, word, strlen(word) ) == 0)
        {
            // address
            fgets(strline, sizeof(strline), fp);
            
            token = strtok(strline, " ");    // 공백을 delimiter 기준으로 자르기
            token = strtok(NULL" "); // 더 이상 문자열이 없으면 NULL을 반환
            token[strlen(token)-1= '\0';    // gets 함수는 마지막에 \n이 들어가므로 이를 제거하기 위해 널값 삽입
            printf("%s\n", token);
            
            // netmask
            fgets(strline, sizeof(strline), fp);
            
            token = strtok(strline, " ");    
            token = strtok(NULL" "); 
            token[strlen(token)-1= '\0';
            printf("%s\n", token);
            
            // broadcast
            fgets(strline, sizeof(strline), fp);
            
            token = strtok(strline, " ");    
            token = strtok(NULL" "); 
            token[strlen(token)-1= '\0';
            printf("%s\n", token);
                
            // network
            fgets(strline, sizeof(strline), fp);
            
            token = strtok(strline, " ");    
            token = strtok(NULL" "); 
            token[strlen(token)-1= '\0';
            printf("%s\n", token);
            /*
            token2 = strtok(token, ".");
            printf("%s\n", token2);
            token2 = strtok(NULL, "."); 
            printf("%s\n", token2);
            token2 = strtok(NULL, "."); 
            printf("%s\n", token2);
            token2 = strtok(NULL, "."); 
            printf("%s\n", token2);
            */
            
        }    
    
    //    memset( &strline, 0, sizeof(strline) );
    //    printf("hello\n");
    }    
    
    fclose(fp);
    return 0 ;
}
cs


아래는 위 소스에서 사용된 interfaces 파일 내용 입니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
# /etc/network/interfaces -- configuration file for ifup(8), ifdown(8)
 
# The loopback interface
auto lo
iface lo inet loopback
 
# Wireless interfaces
iface wlan0 inet dhcp
        wireless_mode managed
        wireless_essid any
        wpa-driver wext
        wpa-conf /etc/wpa_supplicant.conf
 
iface atml0 inet dhcp
 
# Wired or wireless interfaces
allow-hotplug eth0
auto eth0
iface eth0 inet static
        address 192.168.0.1
        netmask 255.255.255.0
        broadcast 192.168.0.255
        network 192.168.0.0
        up /etc/network/if-up.d/eth0-up.sh
 
allow-hotplug eth1
auto eth1
iface eth1 inet static
        address 10.104.91.15
        netmask 255.255.255.0
        network 10.104.91.0
        gateway 10.104.91.1
        dns-nameserver 156.147.19.132
        up /etc/network/if-up.d/eth1-up-nat.sh
        down /etc/network/if-post-down.d/eth1-down-nat.sh
cs




 

C언어 정리하기 - 문자열과 문자열 함수

Posted by ironmask84
2015. 4. 8. 13:56 컴퓨터공학/C언어 레퍼런스


자료 출처 : http://ruvendix.blog.me/220263134254

컴퓨터와 문자에 대해서 얼마나 알고들 계시나요?


어떤 프로그래밍 언어든지 문자와 문자열을 다루는 것은 매우 중요해요!

문자를 출력하지않는 프로그램은 거의 없죠~

게임에서 문자가 하나도 나오지 않는다고 생각해보세요...


물론 레벨, 경험치, 돈은 출력이 되겠지만 캐릭터의 이름, 퀘스트의 내용, 공지 사항 등 중요한 것들이 나오지 않습니다...

특히 문자는 게임을 한글화할 때 중요하죠~ 게임을 한글화할 때는 단순히 문자를 출력하는게 아니라 기초 지식이 좀 필요합니다.

그 기초 지식을 아는 분과 모르는 분들을 위해서 포스팅을 가르겠습니다.

문자를 다루기 전에 꼭  알아야할 개념이 [문자 집합(Character Set)]입니다.

문자 집합은 말 그대로 문자들이 모인 것을 말하는데 경우에 따라서는 전 세계가 공유하는 문자 집합도 있습니다.

많이들 들어보셨겠지만 [유니코드(Unicode)]가 대표적이죠.


컴퓨터에서 문자를 표현할 때는 그냥 표현하는게 아니라 규칙이 있습니다.

그 규칙에는 SBCS, MBCS, WBCS 등이 있습니다. 하나씩 살펴볼게요.

<SBCS = Single Byte Character Set>

SBCS는 문자를 표현할 때 1바이트만 사용하는 방식을 말합니다.

컴퓨터는 미국에서 발명되었으므로 당연히 사용하던 문자도 영어였죠.

영어는 1바이트만 사용해서 문자를 표현할 수 있습니다.


정확히 말하자면 7비트를 문자 표현으로 사용하고 마지막 최상위 비트를 오류 검사용 비트인 패리티 비트로 사용해요.

SBCS는 미국의 ANSI에서 만든 ASCII가 대표적입니다.

 

ASCII는 정보 교환을 위해 ANSI에서 만든 코드를 말합니다.


ASCII 표를 보면 65부터 90까지가 영어 대문자 알파벳이고 97부터 122까지가 영어 소문자 알파벳입니다.

어떤 프로그래밍 언어를 배우던지 ASCII를 모르면 문자를 다룰때 좀 어려울거에요.

ASCII는 모든 프로그래밍 언어에서 사용이 가능합니다.


비트탕 2개의 데이터를 표현할 수 있으므로 ASCII는 최상위 비트를 제외하고 127개의 데이터를 표현할 수 있지만

최상위 비트까지 사용해서 총 256개의 데이터를 표현하는 확장형 ASCII도 있습니다.


<DBCS = Double Byte Character Set>

SBCS는 치명적인 문제가 있었는데 일부 다른 나라의 언어들을 표현할 수 없다는 점이였습니다.

즉, 1바이트만으로는 한글, 일본어, 중국어 등은 표현할 수 없습니다.

DBCS는 SBCS의 문제를 해결한 문자 집합으로 문자의 표현 크기를 2바이트로 늘렸습니다.

하지만 DBCS도 ASCII를 사용하기 때문에 코드가 중복되는 문제가 발생했습니다.

이 때문에 SBCS와 DBCS 둘 다 사용해야 했습니다...



<MBCS = Multi Byte Character Set>

MBCS는 SBCS와 DBCS를 잘 조합한 문자 집합입니다.


ASCII는 전 세계가 공통으로 사용하고 그 외의 코드들을 한글, 일본어, 중국어 등의 문자로 표현합니다.


자세히 말하자면 ASCII는 0x00부터 0x7F까지니까 여기까지는 전 세계가 공통으로 사용하고


0x80부터는 각 나라마다 따로 사용합니다. 따라서 0x80부터는 각 나라마다 코드가 겹칠 가능성이 높죠.


일본 게임에서 많이 등장하는(미소녀 연애 시뮬레이션, JRPG, 라이트 노벨 게임 등) S-JIS가 대표적입니다.

MBCS는 지금도 사용합니다. 이 때문에 좀 문제가 발생하기도 해요.

문자를 출력할 때 비주얼 스튜디오에서 설정을 좀 바꿔야하는 경우가 있습니다...


MBCS냐 WBCS냐에 따라 문자의 출력 방식이 달라집니다.

이 부분은 잘 알아두세요.

<WBCS = Wide Byte Character Set>

?WBCS는 MBCS를 보완한게 아니라 전 세계가 공통적으로 사용할 수 있도록 만든 문자 집합입니다.


WBCS보단 MBCS가 편한 경우도 많아서 그런지 대부분의 프로그램들이 WBCS를 잘 안쓰죠.


모든 프로그램들이 WBCS를 사용한다면 게임 한글화도 정말 쉬워집니다...

?WBCS는 주로 인터넷에서 사용됩니다. 전 세계가 공통적으로 사용해야할 필요가 있으니까요.


WBCS의 대표가 유니코드입니다. 유니 코드는 모든 문자를 전부 다 2바이트로 표현합니다.

그리고 전 세계 문자를 다 넣으려다보니 용량이 많이 큽니다... 그래서 MBCS를 많이 사용하긴 하죠.?


문자에 대해서 이해할 때는 가장 넓은 개념이 문자 집합이고 그 안에 EUC-KR, S-JIS, 유니코드 등이 있다고 이해해야 됩니다.

그럼 폰트는 뭔가요? 폰트는 문자를 표현하는 방법을 말합니다.

문자에 해당되는 코드는 그대로 유지하고 문자의 크기, 삐침, 굵기, 기울기 등만 변경하는걸 폰트라고 합니다.

한글화를 해봤는데요 문자 코드가 없던데요? 문자를 코드 말고 이미지로 사용하는 방법도 있습니다.

이런걸 고유 폰트라고 하는데 각 이미지를 코드와 연결해서 사용하는 방식입니다.

고유 폰트를 사용하는 게임들은 한글화가 무진장 어렵습니다...

 

문자 집합에 대해서는 이걸 잘 기억하세요.


MBCS에서는 영어가 1바이트이고 다른 대부분의 문자들이 2바이트입니다. (일본어에서 히라가나는 1바이트)


WBCS에서는 모든 문자가 2바이트입니다.


그렇다면 한글은? 한글은 대부분 2바이트로 표현됩니다.


문자열을 다루는 함수를 사용하기 위해서는 먼저 헤더 파일을 포함시켜주세요.

"string.h" 헤더 파일은 문자열을 다루는 함수들이 선언되어 있고


"ctype.h" 헤더 파일은 문자를 판단하는 함수들이 선언되어 있습니다.

제가 사용한 포인터와 배열입니다.


여기서 중요한건 포인터는 문자열의 주소를 가지고 있을뿐 조작하거나 그런건 못합니다.

문자열을 복사 및 결합 및 변환하려면 문자 배열을 사용해야 합니다.


"strlen()" 함수는 종료 문자(\0)를 제외한 문자열의 크기를 알려주는 함수입니다.

한글은 2바이트이고 공백 문자는 1바이트니까 출력은 제대로 나왔군요.

"strcpy()" 함수는 String Copy의 약자로 문자열을 복사하는 함수입니다.

포인터는 작동하지 않으므로 문자 배열을 사용하세요.

첫 번째 인자가 문자열을 저장할 인자고 두 번째 인자가 복사할 문자열입니다.

보안상의 문제로 "strcpy_s()" 함수를 사용했습니다.


"strncpy()" 함수는 "strcpy()" 함수와 비슷합니다.

마지막 인자는 바이트를 나타는데 몇 바이트만큼 복사할지를 설정합니다.



"strcpy()" 함수의 문제를 "strdup()" 함수로 해결할 수도 있습니다.

String Duplication의 약어로 문자열을 복사하는 함수입니다.


다만 문자열을 복사할 때 동적 메모리 할당을 이용해서 문자열의 크기만큼 복사합니다.

동적 메모리 할당을 이용하므로 포인터를 사용해서 주소를 받아야 합니다.?

"strcat()" 함수는 String Concatenation의 약어로 문자열을 붙이는 함수입니다.



"strchr()" 함수와 "strstr()" 함수는 문자열에서 문자와 문자열을 찾는 함수입니다.

약간 사전과 비슷하죠? 사전 프로그램을 만들 때 많이 사용하는 함수입니다.


"strcmp()" 함수는 조건문을 사용할 때 많이 사용하는 함수입니다.

문자열과 문자열을 비교해서 같은지 다른지를 판단합니다.

조건문에 사용하면 문자열을 입력받아 문자열을 검사하는 프로그램을 만들 수 있어요.

문자열1 > 문자열2면 양수를 반환하고

문자열1 == 문자열2면 0을 반환하고

문자열1 < 문자열2면 음수를 반환합니다.


"strupr()" 함수와 "strlwr()" 함수는 영어 알파벳을 대문자 및 소문자로 바꿔주는 함수입니다.

보안상의 이유로 "_strupr_s()" 함수와 "_strlwr_s()" 함수를 사용해야 하지만 이게 더 불안정합니다...

그래서 "_strupr()" 함수와 "_strlwr()" 함수를 사용했습니다.

컴파일하면 경고문이 출력되긴 하지만 무시해도 괜찮아요.

그냥 함수를 새로 만들 수도 있습니다.

ASCII에서 영어 대문자와 소문자의 코드를 이용하면 대소문자 바꾸는건 간단해요.

영어 대문자를 영어 소문자에 해당되는 코드로 바꿔치기하면 간단하죠~



입력한 문자가 무슨 문자인지 잘 판단해주네요~

이 함수들을 자세히 파헤치자면 문자가 맞으면 0이 아닌 값을 반환하고 문자가 틀리면 0을 반환하는 형식입니다.


C언어의 기초를 어느정도 알고나면 후반부는 이런식으로 함수들을 몇 개 소개합니다.


그리고 그 함수들을 싹~다 모은걸 라이브러리라고 하는데 라이브러리는 보통 책에서는 잘 나오지 않죠.


C언어에서 제공하는 함수를 C 라이브러리라고 하는데 정말 많습니다... 그렇다고 다 알 필요는 없고요.

필요할 때 찾아서 사용하면 되는거에요~ 대부분의 프로그래밍이 이런 방식입니다.


머리가 정말 좋다면 모든 함수를 다 외워서 사용하겠지만... 기초 함수들만 알고 있어도 수많은 응용이 가능하답니다.

 


 

C언어 강좌 문자열 배열과 null

Posted by ironmask84
2015. 4. 3. 16:53 컴퓨터공학/C언어 레퍼런스


출처 : http://blog.naver.com/kwy4122?Redirect=Log&logNo=220305490766

■ 배열까지 진도가 나갔네요. ㅎㅎ 혹시 이 글을 가장 먼저 보시는 분들은 배열의 개념에 관련된 내용은 앞쪽 글들 참고하시고요. 여기서는 문자열 배열(char)과 null에 대해서 알아보겠습니다. 


■ C언어 자료형 중에서 char 자료형을 이용하면 문자열 배열을 저장할 수 있고, 변경도 가능합니다. 변경이 가능하다는 건 변수 형태로 문자열 저장이 가능하다는 의미이기도 하겠죠? C언어에서는 문자열을 표현할 때 큰따옴표(")를 사용하는데요. 이번에도 역시 예제를 먼저 만들어보겠습니다.



■ char형 aaa라는 배열이 메모리에 할당되고, [Hello World!] 문자열이 순서대로 저장됩니다. 그리고 지난 글에서 알아봤던 sizeof() 함수를 이용해서 배열의 길이를 구해서 출력하고 있는데요. 배열의 길이가 '13'이군요. 위 예제에서 char aaa[]="Hellw World!"는 char aaa[13]..... 인데, 배열 길이 값 '13'을 생략하고 초기화 하면 컴파일러가 자동으로 길이 값을 채워준다는 것도 배열 개념 알아볼 때 정리했었습니다. 참고하시구요. 


■ 그런데 좀 이상하지 않나요? 큰따옴표 안에는 공백 포함해서 정확히 12개의 문자열이 저장되어 있습니다. 아직 안 세어보셨으면 세어보세요. 분명히 공백 포함해서 12개입니다. 그런데 배열의 길이가 13으로 표시되네요? 여기에서 null 문자(\0)가 등장하게 됩니다. C언어에서는 문자열을 저장할 때 맨 마지막에 무조건 null 문자가 저장되는데요. 이유는 다음과 같습니다. 


■ 메모리에 문자열이 저장될 때 이진수로 저장되기 때문에 문자열의 시작과 끝을 표시할 수 있는 방법이 없습니다. 하지만 문자열의 시작은 char aaa[0]; 자리인 건 알 수 있습니다. 문제는 끝을 알 수가 없다는 건데요. 그 끝을 표시해주는 게 null 문자(\0)입니다. 그래서 무조건 문자열의 끝에는 null 문자가 붙게 됩니다. 이 녀석의 아스키코드값과 char형의 값을 출력해보겠습니다.



■ 배열의 마지막 자리[13]에 있는 null의 값을 정수와 문자 형태로 출력했습니다. 숫자 값은 "0"인걸 알 수 있고요. 문자 형태의 값은 아무것도 없습니다. 여기서 주의해야 할게 하나 있는데요. 공백이 아니고, 아무것도 없는 겁니다. 참고로 공백의 아스키코드값은 "32"입니다. 마지막으로 null과 " " 공백의 아스키코드 값을 출력해볼게요.



■ char 형태의 '\0'과 공백 ' '의 값을 정수(%d) 형태로 출력하고 있는 내용입니다. 확실하게 구분이 되죠?^^

 

C언어 정리하기 - 자료형이 곧 핵심

Posted by ironmask84
2015. 4. 1. 21:57 컴퓨터공학/C언어 레퍼런스


아래 자료 출처 :  http://ruvendix.blog.me/220263134254 

오~ 드디어 자료형까지 왔네요. 그런데 여기서부터 변화를줄까 합니다.

제가 설명은 최대한 쉽게하고 있으나 너무 길어진다는 단점이 생겨서...

아예 확 줄여버릴까 해요.

너무 길면 보는 사람들도 지루해하고 제가봐도 좀 짜증나더라고요...

이제는 글보다는 그림으로~ 긴 설명은 죄다 요약글을 활용할게요.

?아무리 길어도 그림만 넘치면 지루하지는 않겠죠?

그래서 강의 자료의 도움을 받을게요.

원래 무료로 제공하는 강의 자료고 제가 뭐 돈 주고 판다던가 그런것도 아니고...

뭔가 그럴듯한 그림이라면 다 프리렉의 저작권이라고 보시면 됩니다.

강의 자료를 사용하는게 문제가 된다면 댓글로 알려주세요~

moon_and_james-3

와... 하고싶은 말만 했는데도 벌써 길어지네요? 이제 시작할게요.

[자료형(Data Type)]은 모든 프로그래밍 언어에서 사용해요.

왜 그럴까요? 자료형은 컴파일러가 정보를 메모리에 저장하거나 가져올때 유용하기 때문입니다.

집을 짓는데 주택인지 아파트인지 오피스텔인지 이렇게 구분하는거에요~

만약 구분을 하지 않는다면? 집이 어떤 형태의 집인지 알 수가 없겠네요...

자료형은 변수에만 해당되는게 아니라 함수에도 해당이 됩니다.

근데 뭐... 함수는 아직 설명할때가 아니므로 변수만 설명할게요.

 


그동안 포스팅을 진행하면서 몇 번 얘기했었지만 변수는 형식이 있어요.

변수를 만들때는 [자료형 | 변수의 이름 | 변수의 값] 이렇게 만든답니다.

이걸 비유하자면 "집의 종류, 집의 이름, 집에서 사는 사람" 이렇게 되겠네요.

"&"는 주소 연산자로 변수나 함수가 시작되는 위치를 알려줍니다.


자료형은 크게 고정 소수점 수 자료형과 부동 소수점 수 자료형이 있어요~1

moon_and_james-38

너무 어려운 말이죠?

컴퓨터는 2가지의 자료형만 아는데 [정수형 자료형]과 [실수형 자료형]으로 구분해요.

?이제 정수형 자료형부터 알아볼건데 이번 포스팅에서는 알면 좋은 정보가 있어요.?

 

자료형에 대한 설명을 봤던 분들이라면 잘 아시겠지만 자료형은 크기가 중요합니다.

주택과 아파트는 크기가 다르죠? 보통 아파트가 건물이 더 큽니다.

그리고 그 크기를 이용해서 최댓값과 최솟값을 알 수 있어요~ 아파트가 1층부터  몇 층까지 있는지 알 수 있듯이요.

C언어에서는 명령어 [sizeof()]를 사용하면 자료형의 크기를 알 수 있습니다.?

"()" 여기 안에 자료형이나 변수를 넣으면 크기를 바이트로 알려줘요.


그리고 그 바이트를 이용해서 최솟값과 최댓값을 알아낼 수 있습니다.

위의 이미저처럼 최솟값과 최댓값을 계산하는데 비트로 계산해요. 1바이트는 8비트입니다.

4바이트의 자료형의 최솟값과 최댓값을 구해보면 이렇게 되겠네요.?

-231 ~ +231 - 1?

즉, -2147483648 ~ 2147483647이 되겠네요~ 왜 저런 공식이 나왔을까요??

 


공식을 적용하면 바이트를 이용해서 최솟값과 최댓값을 구할 수 있겠죠?

정말 많이 사용하니까 잘 알아두세요~ 자료형의 크기를 알려면 [sizeof()]를 사용해야 합니다.

함수가 아니라 C언어의 명령어니까 헷갈리지 않도록해요~


그런데 최솟값과 최댓값의 범위를 넘어가면 어떻게 되는걸까요? 최상위 비트는 고정이므로 변하지는 않을테고...

최솟값의 범위보다 내려가는걸 [언더 플로우(Under Flow)]라 하고

최댓값의 범위보다 올라가는걸 [오버 플로우(Over Flow)]라 합니다.

자료형을 사용하면서 정말~ 많이 발생하는 오류니까 잘 알아두세요!


이제 자료형을 하나씩 알아볼건데 int형부터 알아볼거에요.


int형은 가장 많이 사용하는 자료형으로 종류도 다양합니다.

int형은 보통 [short, int, long, long long]으로 사용하고 여기에 [unsigned]를 조합한 형태로 많이 사용해요.

컴파일러가 알아서 판단하기는 하지만 원래는 short int, int, long int, long long int로 써야 맞습니다.

생략하기보다는 직접 다 써보는게 아마 더 도움이 될거에요~

최솟값과 최댓값을 알아내기 위해 몇 바이트인지 알아볼게요.


소스 코드가 슬슬 복잡해지네요... 천천히 읽어보세요...

?sizeof()를 잘 활용해야 합니다. 자료형을 넣어도 되고 변수를 넣어도되요~



?

?알록달록 하네요~ 각 크기를 알아본건데 short int나 short나 둘 다 2바이트죠? 같은 자료형입니다.

가장 큰 자료형은 long long int로 8바이트나 되네요.

그런데 int는 원래 4바이트가 아니였어요. 컴퓨터 시스템이 발전하면서 크기가 커진것이지요.

C언어는 약 40년동안 계속 업데이트되고 새로 생긴것도 많아요. scanf_s() 함수가 그런거지요.

그래서 이건 보고싶은 분들만 보세요~


 

int 자료형들의 바이트를 알았으니 최솟값과 최댓값을 알 수 있겠네요.

그런데 이걸 굳이 계산 안해도 C언어에서 매크로 상수로 제공해줍니다.

"limits.h"? 헤더 파일은 int 자료형의 최솟값과 최댓값을 매크로 상수로 제공해줘요.

각 매크로 상수의 이름들이 보이죠? int 자료형들과 비교해보세요~


"%u"는 unsinged 자료형의 값을 제대로 출력하기 위해서 사용하는 형식 문자입니다.


 "%lld"는 long long int를 출력할때 사용해요. 나중에 만들어진 자료형은 형식문자가 따로 있어요.


"%llu"는 unsigned long long int를 출력할때 사용합니다.

?4바이트와 8바이트의 엄청난 값 차이...

unsinged long long int의 최댓값은 1844경...

moon_and_james-13

?

?char 자료형은 문자를 표현하기 위해 만든 자료형입니다.


ASCII로 문자를 표현할때는 7비트만 사용하고 나머지 하나의 비트는 패리티 비트3로 사용해요.


그러니 굳이 int처럼 4바이트로 만들 이유가 없죠? char 자료형은 1바이트 입니다.


char는 1바이트니까 메모리에서 한 칸을 차지하고


int는 4바이트니까 메모리에서 4칸을 차지합니다.


실제로 숫자가 저렇게 들어가는건 아니므로 오해하면 안돼요~


컴퓨터는 문자도 다 숫자로 인식합니다. 이 얘기만 몇 번째야...


컴퓨터가 문자를 숫자로 인식하는 방법이 참 여러가지인데 ASCII가 그 중 하나입니다.


ASCII는 영어와 일부 특수 문자들을 1바이트로 만든건데 개수도 255개4인가 그래요.


ASCII 표를 보면 영어 대문자가 65부터 90까지고 영어 소문자가 97부터 122까지네요.


약간 헷갈릴 수 있는게 ASCII는 영어를 1바이트로 표현하지만 유니코드는 2바이트로 표현해요.


ASCII나 유니코드 같은걸 문자 집합(Character Set)이라 하는데 이건 나중에 설명할게요.

 

char에 그냥 숫자를 넣어도 되고 작은 따옴표('')를 사용해서 넣어도 됩니다.

단! char 자료형은 1바이트이므로 문자 하나만 인식할 수 있어요.

그리고 큰 따옴표("")는 사용할 수 없답니다.



? 

첫 번째 출력 결과는 10에서 1이 짤리고 0만 출력되었네요.


두 번째 출력 결과는 ASCII로 10이 "\n"이므로 다음 줄로 갔군요.


문자를 입력하면 ASCII로 바꿀 수 있고 ASCII를 입력하면 문자로 바꿀 수 있어요.


?float 자료형은 int 자료형보다 보다 더 정확한 값이 필요할때 사용해요.


int 자료형만큼 종류가 많지도 않고 굉장히 간단합니다.


[float, double, long double] 이렇게 3개만 있어요. unsigned는 없답니다.


?float 자료형은 소수점마다 출력 범위가 다른데 float은 소수점 이하 6번째 자리까지 제대로 출력합니다.

double이나 long double은 같은 자료형이에요. 소수점 이하 15번째 자리까지 제대로 출력합니다.


?0.12345678908765432이라는 소수점 17자리 수를 출력하면 float은 0.123456까지 제대로 나옵니다.


0.1234567까지 나오는데요? 제대로 나온게 아니라 숫자가 말린겁니다.


double이나 long double은 0.123456789087654까지 제대로 나옵니다.

?바이트를 알았으니 float 자료형의 최솟값과 최댓값을 알아보죠.



?float 자료형의 최솟값과 최댓값은 "float.h" 헤더 파일에 매크로 상수로 있습니다.

소스 코드를 보면 매크로 상수를 알 수 있을거에요.


?

?float 자료형의 최솟값과 최댓값은 뭔가 환상적이네요?


아니 8바이트인데 뭐가 이렇게 복잡하게 나오는걸까요?


고정 소수점 수와 부동 소수점 수의 차이입니다.?


숫자의 범위가 워낙 크기 때문에 "%lf"로는 출력이 어려워요.

그래서 지수 표현으로 출력하는 "%le"를 사용합니다.?

int 자료형과 char 자료형 그리고 float 자료형을 알아봤어요.


그런데 각 자료형은 서로 섞일 수도 있고 다른 자료형으로 바꿀 수도 있습니다.


자료형을 섞으면 보통 바이트가 큰 자료형으로 합쳐져요.


int 자료형과 float 자료형을 섞으면 float 자료형이 됩니다.


char 자료형과 int 자료형을 섞으면 int 자료형이 되고요.


이렇게 섞는거 말고 자료형을 바꿀 수도 있는데 2가지의 경우가 있어요.

하나는 컴파일러가 알아서 바꾸는 [자동 형변환(Auto Type Casting)]이 있고


사용자가 자료형을 바꾸는 [강제 형변환(Coercion Type Casting)]이 있습니다.

?자동 형변환은 이렇게 컴파일러가 자료형을 막 바꿉니다.


컴파일러는 기본적으로 실수를 double로 보는데 사용자가 float으로 선언하면 잘라버립니다.


그래서 float은 값이 제대로 나올때도 있고 아닐때도 있어요...



강제 형변환은 이렇게 사용자가 직접 자료형을 바꿉니다.


"()" 안에 바꾸고싶은 자료형을 입력하면 자료형이 변해요.

int 자료형과 double 자료형을섞는 소스 코드입니다.

double 자료형을 제대로 출력하려면 "%lf"를 써야해요.


?int 자료형과 double 자료형을 더하면 double이 되네요.


int 자료형끼리 연산하면 int 자료형이 되지만~

강제 형변환으로 double로 바꾸면 double 자료형으로 값이 바뀝니다.

C언어에서는 사용자가 직접 자료형을 만들기도 합니다.

정확히 말하자면 원래있던 자료형을 이용해서 이름을 바꾸는거지요.


??typedef는 Type Definition의 줄임말입니다.


typedef를 쓰고 기존 자료형을 쓰고 새로운 이름을 쓰는건데 이걸 왜 쓰는걸까요?


기존 자료형을 두는게 더 좋은거 아닌가요? 맞는 말이긴 하지만 아닌 경우도 있어요.


?unsigned long long int 같은 경우는 기존 자료형이지만 무지 깁니다.


그래서 typedef를 사용하면 이걸 확~ 줄일 수 있어요.


unsigned long long int를 ULLINT로 새롭게 만들면 줄어들겠죠?

?typedef를 사용하면 뭐가 뭔지 모르는 경우가 있는데 그러면 자료형에 마우스를 올려보세요.

빨간색으로 표시한 것처럼 어떻게 만들어진 자료형인지 알려준답니다.


?

unsigned long long int나 ULLINT나 둘 다 똑같은 자료형입니다.


둘 다 8바이트의 자료형이라는걸 확인할 수 있죠??

여기까지~ 자료형에 관한 포스팅이였습니다.


포스팅 방식을 좀 새롭게 바꾸니까 평소보다 짧아진 느낌이 들죠?


다음 포스팅에서는 C언어의 꽃이자 프로그래밍 언어의 꽃인 반복문을 설명할게요.

 

Sprintf 함수

Posted by ironmask84
2010. 11. 24. 14:15 컴퓨터공학/C언어 레퍼런스


sprintf
#include <stdio.h> // C++ 에서는 <cstdio>

int sprintf ( char * str, const char * format, ... );


str 에 데이터를 형식에 맞추어 쓴다.
str 가 가리키는 배열에 형식 문자열에 지정한 방식 대로 C 문자열을 쓴다. 쉽게 설명하자면, printf 에서 화면에 출력하는 대신에 화면에 출력할 문자열을 인자로 지정한 문자열에 쓴다는 것이다. 이 때, 인자로 지정한 배열의 크기는 배열에 쓰여질 문자열의 크기 보다 커야만 한다. 주의할 점은 sprintf 함수는 자동적으로 str 맨 마지막에 NULL  문자를 붙이기 때문에 항상 한 칸의 여유가 있어야 한다.

   인자
 

str

C 문자열이 저장될 char 배열을 가리키는 포인터
 
format

위 str 에 쓰여질 문자열을 포함하는 형식 문자열으로, 이는 형식 태그를 포함할 수 있다. 이 때, 형식 태그는 부수적 인자로 지정한 데이터와 치환되어 쓰여지게 된다. 이 때, 데이터가 치환되는 방식은 형식 태그에 의해 좌우된다. 따라서 부수적 인자의 개수는 적어도 형식 문자열에 사용된 형식 태그의 수 보다 많아야 한다.
  • 형식 태그는 아래와 같이 생겼다.

  • %[플래그(flag)][폭(width)][.정밀도][크기(length)]서식 문자(specifier)

  • 이 때 서식 문자(specifier) 는 대응하는 인자를 어떠한 형태로 표현할지를 결정하는데에 가장 중요한 역할을 한다.

  • 서식문자 출력 형태

    c 문자
    a
    d or i 부호 있는 십진법으로 나타난 정수 392
    e 지수 표기법(Scientific notation) 으로 출력하되, e 문자를 이용한다.
    3.9265e+2
    E 지수 표기법(Scientific notation) 으로 출력하되, E 문자를 이용한다. 3.9265E+2
    f 십진법으로 나타낸 부동 소수점 수
    392.65
    g %e 나 %f 보다 간략하게 출력 392.65
    G %E 나 %f 보다 간략하게 출력 392.65
    o 부호 있는 팔진수
    610
    s 문자열
    sample
    u 부호없는 십진법으로 나타낸 정수
    7235
    x 부호없는 16 진법으로 나타낸 정수 (소문자 사용)
    7fa
    X 부호없는 16 진법으로 나타낸 정수 (대문자 사용)
    7FA
    p 포인터 주소
    B800:0000
    n 아무것도 출력하지 않는다. 그 대신, 인자로 부호 있는 int 형을 가리키는 포인터를 전달해야 되는데, 여기에 현재까지 쓰여진 문자 수가 저장된다.
    % % 다음에 %를 또 붙이면 stdout 에 % 를 출력한다.

  • 위 서식 문자를 이용한 다양한 출력 형태는 아래와 같다.

  • #include <stdio.h>
    int main()
    {
        int integer = 123;
        char character = 'c';
        char string[] = "hello, world";
        int* pointer = &integer;
        double pi = 3.141592;
        char buf[100];
        

        sprintf(buf, "integer : (decimal) %d (octal) %o \n", integer, integer);
        printf("%s \n", buf);

        sprintf(buf,"character : %c \n", character);
        printf("%s \n", buf);

        sprintf(buf,"string : %s \n", string);
        printf("%s \n", buf);

        sprintf(buf,"pointer addr : %p \n", pointer);
        printf("%s \n", buf);

        sprintf(buf,"floating point : %e // %f \n", pi, pi);
        printf("%s \n", buf);

        sprintf(buf,"percent symbol : %% \n");
        printf("%s \n", buf);

        return 0;

  • 출력 결과


  •    형식 태그에는 위 말고도 플래그, 폭, .정확도, 제한자(modifier), 부-서식문자(sub-specifiers) 에 관련된 정보들이 포함될 수 있다. 먼저 플래그를 살펴보면 플래그는 기본적으로 출력되는 형태에 대해 조금 더 자세하게 지정할 수 있게 해준다. 플래그는 아래와 같다.

    플래그 설명
    - 폭에 맞추어 왼쪽 정렬을 하여 출력한다. - 를 붙이지 않는다면 기본적으로 오른쪽 정렬이 되어 출력한다. (아래 폭 지정자 참조).
    + 출력 결과값이 양수인 경우라도 + 기호를 앞에 붙여서 출력하도록 한다. (물론 음수면 자동적으로 - 가 붙는다). 기본적으로 지정하지 않았을 경우 음수에만 앞에 - 가 붙는다. 
    (공백) 앞에 부호가 붙지 않는다면 한 칸을 띄어서 출력한다. (다시말해 123 은 " 123" 으로 출력되고 -123 은 "-123" 으로 출력된다)
    #
    o, x, X 서식 문자들과 사용되면 출력되는 값 앞에 각각 0, 0x, 0X 가 붙게 된다. (이 때 0 은 제외한다)
    e, E, f 서식 문자들과 사용되면 소수점 아래 수들이 없음에도 불구하고 강제적으로 소수점을 붙이도록 한다. 원래 소수점 아래 수들이 없다면 소수점을 붙이지 않는다.
    g 와 G 서식 문자들과 사용되면 e 와 E 일때와 동일한 작업을 하지만 소수들의 뒷부분에 붙는 0 들 (123.1200 등) 은 제거되지 않는다. 
    0 수들을 왼쪽으로 정렬하되 빈 칸을 삽입하는 대신에 0 을 삽입한다. (폭 지정자 참조)

  •   폭은 말그대로 출력되는 데이터의 폭을 지정해준다. 참고로 여기서의 폭(width)은 뒤에 나오는 길이(length) 와는 완전히 다른 개념이므로 유의 하시기 바란다.


  • 설명
    (수) 출력할 최소의 문자 개수. 만일 이 수 보다 출력할 수 보다 작다면 빈칸을 삽입하여 길이를 맞춘다. 대신에, 이 수 보다 출력할 수가 큰 수의 경우 잘려서 출력되지는 않는다.
    * 폭을 형식 문자열에 지정해서 받지 않지만, 그 대신에 형식 문자열 뒤에 오는 인자들에 넣어서 받는다. 이 때, 이는 정수 값이여야 하며 폭을 지정하는 변수 뒤에 출력할 데이터가 위치하면 된다.

  • /* 사용 예 */
    #include <stdio.h>
    int main()
    {
        FILE *fp = fopen("output.txt", "w");
        char buffer[100];
        int i = 123;
        int j = -123;
        double f = 3.141592;

        sprintf(buffer, "폭 맞추기 \n");
        fputs (buffer, fp);
        sprintf(buffer, "i : %6d \n", i);
        fputs (buffer, fp);
        sprintf(buffer, "i : %7d \n", i);
        fputs (buffer, fp);
        sprintf(buffer, "i : %2d \n\n", i);
        fputs (buffer, fp);

        sprintf(buffer, "왼쪽 정렬 \n");
        fputs (buffer, fp);
        sprintf(buffer, "i : %5d끝 \n", i);
        fputs (buffer, fp);
        sprintf(buffer, "오른쪽 정렬 \n");
        fputs (buffer, fp);
        sprintf(buffer, "i : %-5d끝 \n\n", i);
        fputs (buffer, fp);

        sprintf(buffer, "# 문자의 사용 \n");
        fputs (buffer, fp);
        sprintf(buffer, "i : %#x \n", i);
        fputs (buffer, fp);
        sprintf(buffer, "i : %#X \n\n", i);
        fputs (buffer, fp);

        sprintf(buffer, "부호 붙이기 \n");
        fputs (buffer, fp);
        sprintf(buffer, "%+d, %+d \n", i,j);
        fputs (buffer, fp);
        return 0;
    }

  • 출력 결과

  • 파일에 쓰여진 모습

  • 정밀도는 말그대로 수치 데이터를 출력할 때 어떠한 정밀도로 출력하는지 (즉, 몇 자리 까지 출력해야 되는지) 를 지정해준다. 참고적으로 정밀도를 나타낼 때, 앞에 꼭 마침표(.) 을 찍는 것을 잊지 말기 바란다. 마침표를 찍는 이유는 앞에 폭과 구분을 하기 위해서 이다.

  • . 정밀도 설명
    .숫자 정수 지정자 (d,i,o,u,x,X) 의 경우 : 정밀도는 출력되야할 최소의 자리수를 일컫는다. 만일, 어떤 정수의 자리수가 정밀도 보다 작다면 앞에 0 이 붙어서 자리수를 맞추게 된다. 또한 자리수가 더 크다고 해서 정수를 잘라서 출력하지는 않는다. 만일 정밀도가 0 이라면, 소수점 뒤에 자리수를 출력하지 않는다.
    e,E, F 의 경우 : 여기서 정밀도는 소수점 이하 출력될 자리수를 의미한다.
    g, G 의 경우 : 출력될 유효 숫자의 수를 의미한다.
    s 의 경우 : 출력될 문자의 최대 개수를 의미한다. 원래는 널 문자를 만나기 전까지 모든 문자가 출력되었었다.
    c 의 경우 : 아무 효과 없다.
    만일 정밀도가 지정되지 않는다면 기본값으로 1 이 된다. 또한, 마침표(.) 을 찍었는데 아무런 숫자를 적지 않았다면 기본적으로 0 이 적혔다고 생각한다.
    .* 형식 문자열에서 정밀도를 나타내지는 않지만 뒤에 인자로 정밀도 값을 준다. 이 때 인자는 형식 태그가 적용되는 데이타 앞에 있어야 한다.  

       길이는 출력하는 데이터의 정확한 크기를 지정하는데 사용된다. 예를 들어서 %d 서식문자의 경우 막연하게 '정수형 데이터를 십진법으로 출력한다' 였지만 길이를 지정해주면 어떻나 크기로 데이터를 출력해야되는지 (int 냐 short 냐 등등) 을 지정할 수 있다. 

  • 길이
    설명
    h 인자를 short int 혹은 unsigned short int 로 생각한다. (오직 i, d, o, u , x, X 서식 문자에만 적용된다)
    l 정수 서식 문자(i,d,o,u,x, X) 에 사용되었을 경우 인자를 long int 나 unsigned long int 로 생각하며 c 나 s 에 사용되었을 경우 wide character 나 wide string 으로 생각한다.
    L 인자를 long double 로 생각한다. (오직 부동 소수점 서식 문자인 e,E,f,g, G 에만 적용된다)

  • /* 사용 예 */
    #include <stdio.h>
    int main()
    {
        double f = 3.141592;
        int i = 12345;
        char buffer[100];

        sprintf(buffer, "f : %.3f \n", f);
        printf("buf: %s \n", buffer);
        sprintf(buffer, "i : %.10d \n", i);
        printf("buf : %s \n", buffer);

        return 0;
    }

    출력 결과


    부수적인 인자

    형식 문자열에 따라 함수는 여러 인자들을 가지며, 각 인자는 형식 문자열의 각 형식 태그에 순차적으로 대응된다. 기본적으로 형식 문자열에 들어 있는 형식 태그의 수와 뒤따라 붙는 인자들의 수는 같아야 한다. (물론 .* 이나 * 과 같은 예외적인 상황은 제외한다)

       sprintf 함수의 활용 - 수를 문자열로 바꾸기
     

    sprintf 함수를 잘 이용하면 수를 손쉽게 문자열로 바꿀 수 있다. 바로 다음과 같이.

    #include <stdio.h>
    int main()
    {
        int i;
        char str[100];

        scanf("%d", &i);
        sprintf(str, "%d", i);

        printf("str : %s \n", str);

        return 0;
    }


    실행 결과


    i 의 값을 %d 의 형태로 str 에 문자열로 넣었으니 str 에는 i 의 값이 문자열의 형태로 변환된다.
    마찬가지 방법으로 i 의 값을 16 진수나 8 진수 형태로 (%x, %o) 넣을 수 도 있다.

       리턴값
     

    str 에 쓰기가 성공할 경우 쓰여진 총 문자의 개수가 반환된다. 이 때, 이 문자의 개수는 맨 마지막에 자동적으로 붙는 NULL 문자는 포함하지 않는다.
    실패할 경우 음수가 리턴된다.

       실행 예제
     

    /*

    sprintf 함수 예제
    이 예제는 http://www.cplusplus.com/reference/clibrary/cstdio/sprintf/
    에서 가져왔습니다.

    */
    #include <stdio.h>
    int main ()
    {
        char buffer [50];
        int n, a=5, b=3;
        n=sprintf (buffer, "%d plus %d is %d", a, b, a+b);
        printf ("[%s] is a %d char long string\n",buffer,n);
        return 0;
    }


    실행 결과



       연관된 함수
     

    • printf  :  표준 출력(stdout) 에 데이터를 형식에 맞추어 출력한다.
    • sscanf  :  문자열에서 데이터를 형식에 맞추어 읽는다.