detect(3) Library Functions Manual detect(3)

이름

detect, detect_r - 문자열의 문자셋과 정확도를 측정

사용법

#include <chardet.h>

short detect (char * inbuf, DetectObj ** outbuf);

short detect_r (char * inbuf, size_t inlen, DetectObj ** outbuf);

설명

inbuf 의 문자셋과 정확도를 outbuf에 저장한다.

detect API는 binary safe 문제로 더이상 사용을 권장하지 않습니다. detect_r API를 이용하십시오.


문자셋과 정확도를 측정할 입력 문자열

inlen
문자셋과 정확도를 측정할 입력 문자열의 길이


inbuf 의 문자셋과 정확도를 구하여 저장을 한다. outbuf 의 구조는 다음과 같다.
typedef struct DetectObject {
	char * encoding;
	float confidence;
	short bom;
} DetectObj;

outbuf는 detect_obj_init api를 이용하여 초기화를 한 후에 detect api로 넘겨줘야 한다.

반환값

경우에 따라 아래의 상태를 반환한다.


성공

탐지하지 못했을 경우

outbufchardet_obj_init api를 이용하여 메모리 할당을 하지 않았을 경우.

내부 API에서 out of memory 가 발생했을 경우

예제

#include <chardet.h>
int main (void) {
	DetectObj *obj;
	if ( (obj = detect_obj_init ()) == NULL ) {
		fprintf (stderr, "Memory Allocation failed\n");
		return CHARDET_MEM_ALLOCATED_FAIL;
	}
	//switch (detect ("안녕하세요", &obj))
	switch (detect_r ("안녕하세요", 10, &obj))
	{
		case CHARDET_OUT_OF_MEMORY :
			fprintf (stderr, "On handle processing, occured out of memory\n");
			detect_obj_free (&obj);
			return CHARDET_OUT_OF_MEMORY;
		case CHARDET_NULL_OBJECT :
			fprintf (stderr,
					"2st argument of chardet() is must memory allocation "
					"with detect_obj_init API\n");
			return CHARDET_NULL_OBJECT;
	}
	# obj-bom 은 CHARDET_BOM_CHECK 상수 지원여부로 지원을 판단할 수 있습니다.
	printf ("encoding: %s, confidence: %f, exists bom: %d\n", obj->encoding, obj->confidence, obj->bom);
	detect_obj_free (&obj);
    return 0;
}

저자

김정균

버그 리포트

https://github.com/Joungkyun/libchardet/issues

참고

detect_handledata(3), detect_obj_init(3), detect_obj_free(3)

2019-08-01 libchardet manuals