//	ggch.c		gg630504 hg9ieg linux.ubuntu.gcc
//	2010-03-06 - 2017-09-17

#include <stdlib.h>
#include <string.h>
#include <stdio.h>

#include "ggstd.h"
#include "ggbit.h"
#include "ggch.h"

CH	chUprFromB[] = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ";

SZ		szASCIICh[];	// 0..31
SZ		szASCIICh[] = {
// 0      1      2      3      4      5      6      7      8      9      a      b      c      d      e      f     
"NUL", "SOH", "STX", "ETX", "EOT", "ENQ", "ACK", "BEL", "BS",  "HT",  "LF",  "VT",  "FF",  "CR",  "SO",  "SI",
"DLE", "DC1", "DC2", "DC3", "DC4", "NAK", "SYN", "ETB", "CAN", "EM",  "SUB", "ESC", "FS",  "GS",  "RS",  "US"
};

//----------------------------------------------------------------------

SZ		SzASCIISzCh( SZ, CH );
SZ		SzASCIISzCh( sz_, ch_ )
SZ		sz_;
CH		ch_;
{
if( (UCH)ch_==127 )
	strcpy( sz_, "del" );
else	if( (UCH)ch_>=0 && (UCH)ch_<=31 )
		strcpy( sz_, szASCIICh[(UCH)ch_] );
	else	{
		sz_[0] = ch_;
		sz_[1] = chEos;
		}
return( sz_ );
}

//----------------------------------------------------------------------

SZ		SzASCIICu( CU );
SZ		SzASCIICu( cu_ )
CU		cu_;
{
return( cu_==127 ? "del" : ( cu_>=0 && cu_<=31 ? szASCIICh[cu_] : szNULL ) );
}

//----------------------------------------------------------------------
// unikódra utf-8 szöveg 1 karakterét
// ggfs.c - CuGetH()

CU		CuFromPsz( psz_ )
PSZ		psz_;	// be/ki:	utf8-ra mutató
			// vissza:	unicode
			// oldal:	utf8-ra mutató továbblép a következő karakterre
{
CU		cuAct;
UCH		uchAct;

cuAct = 0;
uchAct = (UCH)*((*psz_)++);

if( (uchAct & B10000000)==B00000000 ) // 0xxx xxxx
	{
	return( uchAct );
	}
else	if( (uchAct & B11100000)==B11000000 ) // 110x xxxx .... ....
	{
	cuAct = uchAct & B00011111;
	uchAct = (UCH)*((*psz_)++);
	if( (uchAct & B11000000)==B10000000 ) // .... .... 10xx xxxx
		{
		cuAct <<= 6;
		cuAct += uchAct & B00111111;
		return( cuAct );
		}
	else	return( rFail );
	}
else	if( (uchAct & B11110000)==B11100000 ) // 1110 xxxx .... .... .... ....
	{
	cuAct = uchAct & B00001111;
	uchAct = (UCH)*((*psz_)++);
	if( (uchAct & B11000000)==B10000000 ) // .... .... 10xx xxxx .... ....
		{
		cuAct <<= 6;
		cuAct += uchAct & B00111111;
		uchAct = (UCH)*((*psz_)++);
		if( (uchAct & B11000000)==B10000000 ) // .... .... .... .... 10xx xxxx
			{
			cuAct <<= 6;
			cuAct += uchAct & B00111111;
			return( cuAct );
			}
		else	return( rFail );
		}
	else	return( rFail );
	}
else	if( (uchAct & B11111000)==B11110000 ) // 1111 0xxx ... ... ... ... ... ...
	{
	cuAct = uchAct & B00000111;
	uchAct = (UCH)*((*psz_)++);
	if( (uchAct & B11000000)==B10000000 ) // .... .... 10xx xxxx .... .... ... ...
		{
		cuAct <<= 6;
		cuAct += uchAct & B00111111;
		uchAct = (UCH)*((*psz_)++);
		if( (uchAct & B11000000)==B10000000 ) // .... .... .... .... 10xx xxxx ... ...
			{
			cuAct <<= 6;
			cuAct += uchAct & B00111111;
			uchAct = (UCH)*((*psz_)++);
			if( (uchAct & B11000000)==B10000000 ) // .... .... 10xx xxxx .... .... ... ...
				{
				cuAct <<= 6;
				cuAct += uchAct & B00111111;
				return( cuAct );
				}
			else	return( rFail );
			}
		else	return( rFail );
		}
	else	return( rFail );
	}
else	return( rFail );
}

//-----------------------------------------------------------------------
// http://hu.wikipedia.org/wiki/UTF-8

// visszatérési érték a string végére mutat
SZ		SzFromSzCu( sz_, cu_ )
SZ		sz_;
CU		cu_;
{

if( (cu_ & 0xffffff80) == 0 )			// 00000000 00000000 00000000 0xxxxxxx
	{
	*sz_++ = cu_ & 0x7f;
	}
else	if( (cu_ & 0xfffff800) == 0 )		// 00000000 00000000 00000yyy yyxxxxxx
	{
	*sz_++ = 0xc0 | ((cu_ & 0x7c0) >> 6);	
	*sz_++ = 0x80 | (cu_ &   0x3f );	
	}
else	if( (cu_ & 0xffff0000) == 0 )		// 00000000 00000000 zzzzyyyy yyxxxxxx
	{
	*sz_++ = 0xe0 | ((cu_ & 0xf000 ) >> 12 );	
	*sz_++ = 0x80 | ((cu_ &  0xfc0 ) >> 6 );	
	*sz_++ = 0x80 | (cu_ &    0x3f );	
	}
else	if( (cu_ & 0xffe00000) == 0 )		// 00000000 000wwwzz zzzzyyyy yyxxxxxx
	{
	*sz_++ = 0xf0 | ((cu_ & 0x1c0000 ) >> 18 );	
	*sz_++ = 0x80 | ((cu_ &  0x3f000 ) >> 12 );	
	*sz_++ = 0x80 | ((cu_ &    0xfc0 ) >> 6 );	
	*sz_++ = 0x80 | (cu_ &      0x3f );	

	}

*sz_ = chEos;
return( sz_ );
}

//----------------------------------------------------------------------
// sz_ első karakterét unicode-ra konvertálja
CU		CuFromSz( sz_ )
SZ		sz_;	// be:	utf8-ra mutató
			// vissza:	unicode
{
return( CuFromPsz( &sz_ ) );
}

//----------------------------------------------------------------------
C		CLenSzu( szu_ )
SZU		szu_;	// be: unicode szöveg
			// vissza: unicode karakterek száma
{
C		c;

for( c = 0; !(*szu_==cuEos); szu_++, c++ )
	;

return( c );
}

//----------------------------------------------------------------------
// unicode-os szöveget másol
SZU		SzuCpySzuSzu( d_, s_ )
SZU		d_;	// ki:	cél unicode szöveg
SZU		s_;	// be:	forrás unicode szöveg
			// vissza:	cél unicode szöveg
{
SZU		r;
r = d_;
while( !(*s_==cuEos) )
	*d_++ = *s_++;
*d_ = cuEos;
return( r );
}

//----------------------------------------------------------------------
C		CFromSzuSzC( szu_, sz_, c_ )
SZU		szu_;	// ki:	cél unicode tömb
SZ		sz_;	// be:	forrás utf-8 szöveg
C		c_;	// be:	cél unicode szöveg hossza
			// vissza:	maradék unicode karakterek száma
{
CU		cu;

while( !(c_==0 || (cu = CuFromPsz( &sz_ ))==0) )
	{
	*szu_++ = cu;
	c_--;
	}
*szu_ = cuEos;
return( c_ );
}

//----------------------------------------------------------------------

SZ		SzClangSzCh( sz_, ch_ )	// C stílusú szövegre konvertál karaktert
SZ		sz_;	// ki:	szöveg
CH		ch_;	// be:	karakter
			// vissza:	szöveg
{
if( ch_=='\a' )	{ strcpy( sz_, "\\a" ); goto ret; }
if( ch_=='\b' )	{ strcpy( sz_, "\\b" ); goto ret; }
if( ch_=='\f' )	{ strcpy( sz_, "\\f" ); goto ret; }
if( ch_=='\n' )	{ strcpy( sz_, "\\n" ); goto ret; }
if( ch_=='\r' )	{ strcpy( sz_, "\\r" ); goto ret; }
if( ch_=='\t' )	{ strcpy( sz_, "\\t" ); goto ret; }
if( ch_=='\v' )	{ strcpy( sz_, "\\v" ); goto ret; }
if( ch_=='\\' )	{ strcpy( sz_, "\\\\" ); goto ret; }
if( ch_=='\'' )	{ strcpy( sz_, "\\\'" ); goto ret; }
if( ch_=='\"' )	{ strcpy( sz_, "\\\"" ); goto ret; }
if( (UCH)ch_>=' ' && (UCH)ch_<0x7f )	{ *sz_ = ch_; sz_[1] = chEos; goto ret; }
sprintf( sz_, "\\x%x02X", ch_ ); goto ret;
//-------
ret:
return( sz_ );
}

//----------------------------------------------------------------------
// szöveg elején és végén lévő sp tab karaktereket törli
SZ		SzTrim2Sz( sz_ )
SZ		sz_;	// be, ki: szöveg
{
CH		ch;
PCH		pchTail;

// eleje levágás
ch = *sz_++;
while( FSpaceCh( ch ) )
	ch = *sz_++;
sz_--;
if( ch!=chEos )
	{
	// vége keresés
	pchTail = sz_;
	ch = *pchTail;
	while( ch!=chEos )
		ch = *pchTail++;
	pchTail -= 2;
	ch = *pchTail;
	while( pchTail!=sz_ && FSpaceCh( ch ) )
		{
		ch = *pchTail--;
		}
	pchTail += 2;
	*pchTail = chEos;
	}

return( sz_ );
}

//----------------------------------------------------------------------
// szövegből törli a cr, lf, eof karaktereket

SZ		SzRmCrLfSzCSzC( szDest_, cDest_, szSou_, cSou_ )
SZ		szDest_;	// ki:	cél szöveg
C		cDest_;		// be:	cél szöveg max hossza
SZ		szSou_;		// be:	forrás szöveg
C		cSou_;		// be:	forrás szöveg max hossza
				// vissza: cél szöveg

{
CH		ch;
I		iDest;
I		iSou;

iSou = iDest = 0;

while( iDest<cDest_ && iSou<cSou_ && (ch=szSou_[iSou])!=chEos )
	{
	if( !( ch==chCr || ch==chLf || ch==chEof ) )
		{
		szDest_[iDest++] = ch;
		}
	iSou++;
	}
if( iDest<cDest_ )
	szDest_[iDest] = chEos;

return( szDest_ );
}