Gene Hlac_1919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1919
Symbol
ID	7399871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1922259
End bp	1923518
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	72%
IMG OID	643708990
Product	N-acylglucosamine 2-epimerase
Protein accession	YP_002566567
Protein GI	222480330
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.266603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGA CGACGCGCGA GGCGGTTCGA ACGCAAGCGC GATCGCACCG GGCACGGCTG 
CTTTCGGTCC TGCGCGTGCA GTACCCCGAC GCGCTCGCCG ACCGCGGGTA TCGCCTCATT 
CACCCGACGA CCGGAGATCC CTACGCCGGA GACCGGCGGC ACCTCATCGC GACCTGCCGA 
TCGGTCGCCA ACTTCGCGGT CGGCGCGCTC GCCGACGGCC CCGACTGGTG TCTCGACGCC 
GCCGAGCACG GCCTGCAATT CCTCCGGGAG GCGCACCGCG CCGACGACGG GGGGTATCAC 
CTCGTCGTCG ACGCGGAGGG CGAGCCGGTG GATCGGACGC GGTCGGCGTA CGGCCACGCG 
TTCGTTCTAC TGGCGTACGC CCGCGCGGTC GACGCCGGGA TCGAGGGCGC CGAGCGCGAC 
CTCGACGCGA CCCGAGAGCT GATCGACGAC CGGTTCCGCG ACGACCGGGG ACTCCTCCGG 
AGCGACTGCG ACGCCGACTG GACCGAGCGA GAGCCGTACC GCGGCCAGAA CGCGAACATG 
CACGCCTGCG AGGCGTTCCT CGCCGCCTAC GAGGCGACGG ACGAGGCGAG ATACCTCGAC 
CGCGCGCGTC ACATCGCCGA GGCGATCACG GTCGACCTCG CCGCCGAGAC CGACGGTCTG 
CTGTGGGAGC ACTACACCGC CGACTGGGAG CACGACTTCG CGTACAACGT GGACGAGCCG 
CGCCACCAGT TCCGGCCGCC GGGGTACCAG CCGGGCCACC ACGCGGAGTG GGCGAAGCTC 
CTCGCGCTGC TCGACCGGTA CGAGGGCGAG GAGGGTGAGG ATGGAGAGAG TGAGGATCCA 
GCCGCGACCA TCGACTGGTA CACCCGCGCC CGCGAACTGT TCGACGCCGC AGTCGACCGC 
GGCTGGTCGG AGAACGGATT CGTGTACACC CACGCGGCCG ACGGGTCGCC GATCGTCGCC 
GATCGATACG GGTGGGCGCT CGCGGAGGCG ATCGGCGCGT CCGCGGCACT GGCCGAGCGT 
GCGGCGGCTC GCGGCGACGC CGACGAGGCC GATCGGCTCC GGAACTGGCA TCGGCGGTTC 
CTCGTTCGGA CCGACCTGTT CCGCGGCCCG GCGGGCGTCT GGTACGAGAA GCGCCTGCCC 
GCGGACGCCG ACGGCGACCT CGTCGCACAG GACCCGCCCG GCGTCGAACC CGACTACCAC 
CCGGCCGGCG CGTTCTTCGA GGGGTGGCGC TCCGCGCGGG GAGAGCTGTC TGACGGGTGA

Protein sequence

MNETTREAVR TQARSHRARL LSVLRVQYPD ALADRGYRLI HPTTGDPYAG DRRHLIATCR 
SVANFAVGAL ADGPDWCLDA AEHGLQFLRE AHRADDGGYH LVVDAEGEPV DRTRSAYGHA 
FVLLAYARAV DAGIEGAERD LDATRELIDD RFRDDRGLLR SDCDADWTER EPYRGQNANM 
HACEAFLAAY EATDEARYLD RARHIAEAIT VDLAAETDGL LWEHYTADWE HDFAYNVDEP 
RHQFRPPGYQ PGHHAEWAKL LALLDRYEGE EGEDGESEDP AATIDWYTRA RELFDAAVDR 
GWSENGFVYT HAADGSPIVA DRYGWALAEA IGASAALAER AAARGDADEA DRLRNWHRRF 
LVRTDLFRGP AGVWYEKRLP ADADGDLVAQ DPPGVEPDYH PAGAFFEGWR SARGELSDG