Gene Cthe_2190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2190
Symbol
ID	4810906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2608713
End bp	2609894
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	42%
IMG OID	640107596
Product	N-acetylglucosamine 6-phosphate deacetylase
Protein accession	YP_001038585
Protein GI	125974675
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAA TGAAGCTTGT AAAAAACGGA CTTGTTTTAG ACAGTCAAAA AGGTTTTGAA 
GTAAATGATA TATTGATTGC CGGTGGGAAA ATTGCAAAGA TTGGTAAGAA TATTGAAGTT 
TCGGAAACGG ACTATGAAGT CCTGAATGCT GAAGGCTTTT ATGTTGTTCC GGGATTTATT 
GATGTACACA TGCATGGAGC GGCAGGTGTC GATATTATAA AGGCAGACCC GGGCCGGTTA 
AATGAGCTGT CTTTGTTTCT TGCATCCAAA GGAGTTACGT CTTTTCTTGC TACAGTTATG 
ACTGATTCCA GGGAGAATAT CTGCCGTGCC GTTGAGAATA TCCGTCTTGC CGTGGAAAGA 
GGATTGGATG GTGCCAAAAT AGCCGGCATT AACCTGGAGG GGCCGTTTAT AAACCCAAAA 
TACAGGGGAG CTCACCCGCC GGAATATATA CTGGAGCCTG ATGTGAAATT AATCGATGAA 
CTTGTTGAAA AATCAGGAAA TAATATAAAG CTTGTTACGG CTGCGCCTGA ATTGGACAAA 
ATTGAGGAAA TTATCCGAAA GTTCAAAGAA GACATAATTT TTAGTGCGGG ACATTCCGGT 
GTTGATTTTG CCGGGGCGAA AGAAGCCTTT AAAAATGGTT TTAAACATGT CACTCACCTT 
TTTAATGCAA TGACAGGTAT TCATCACAGG GAGCCGGGGC TTGCAGGAGC GGCGTTGGAC 
AGCGACGATG TCACTGTGGA AATAATTCCC GACCTGATAC ATGTGCATGG AGCGGTAATT 
CAAATGGTTG TCAAGTGTAA AACACCGGAC AGGGTGGTTC TTGTAACCGA TTCTATTTTG 
GCGGCCGGAC TCGGAGAGGG AAAACTTGAG TTTGCAGAAA GCATGATTAC AGTTAAAGAC 
GGTGCGGCCG TTTTTGAAAA CGGTGTGTTG GCCGGAAGTA CCATTACGAT GGCAGACGGT 
ATCGGAAATA TGGTGAAAAA ATTGGGATTC AGCCTTGAGG ATACAATAAA AATGGCTTCA 
ACAAATCCTG CCAAACTTAT AAACATTTTT GACAGGAAGG GAAGCCTGTC AGAAGGAAAA 
GATGCAGATA TTGTAATATT GGACAGAAGT CTGAATATCC ATGAAACAAT AATACAGGGA 
ATTACGGTTT ACTCTACATT TCCATACCCT CAGAGTAGGT GA

Protein sequence

MEKMKLVKNG LVLDSQKGFE VNDILIAGGK IAKIGKNIEV SETDYEVLNA EGFYVVPGFI 
DVHMHGAAGV DIIKADPGRL NELSLFLASK GVTSFLATVM TDSRENICRA VENIRLAVER 
GLDGAKIAGI NLEGPFINPK YRGAHPPEYI LEPDVKLIDE LVEKSGNNIK LVTAAPELDK 
IEEIIRKFKE DIIFSAGHSG VDFAGAKEAF KNGFKHVTHL FNAMTGIHHR EPGLAGAALD 
SDDVTVEIIP DLIHVHGAVI QMVVKCKTPD RVVLVTDSIL AAGLGEGKLE FAESMITVKD 
GAAVFENGVL AGSTITMADG IGNMVKKLGF SLEDTIKMAS TNPAKLINIF DRKGSLSEGK 
DADIVILDRS LNIHETIIQG ITVYSTFPYP QSR