Gene EcolC_2979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2979
Symbol	nagA
ID	6065340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3253619
End bp	3254767
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	641602389
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001725931
Protein GI	170020977
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.821862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGCAT TAACCCAGGG CCGGATCTTT ACCGGCCACG AATTTCTTGA TGACCACGCG 
GTTGTTATCG CTGATGGCCT GATTAAAAGC GTCTGTCCGG TAGCGGAACT GCCGCCAGAG 
ATCGAACAAC GTTCACTGAA CGGGGCCATT CTCTCCCCCG GTTTTATCGA TGTGCAGTTA 
AACGGCTGCG GCGGCGTACA GTTTAACGAC ACCGCTGAAG CGGTCAGCGT GGAAACGCTG 
GAAATCATGC AGAAAGCCAA TGAGAAATCA GGCTGTACTA ACTATCTGCC GACGCTTATC 
ACCACCAGCG ATGAGCTGAT GAAACAGGGC GTGCGCGTTA TGCGCGAGTA CCTGGCAAAA 
CATCCGAATC AGGCGTTAGG TCTGCATCTG GAAGGTCCGT GGCTGAATCT GGTAAAAAAA 
GGCACCCATA ATCCGAATTT TGTGCGTAAG CCTGATGCCG CGCTGGTCGA TTTCCTGTGT 
AAGAACGCCG ACGTCATTAC TAAAGTGACC CTGGCACCGG AAATGGTTCC TGCAGAAGTC 
ATCAGCAAAC TGGCAAATGC CGGGATTGTG GTTTCTGCCG GTCACTCCAA CGCGACGTTG 
AAAGAAGCGA AAGCCGGTTT CCGCGCGGGG ATTACCTTTG CCACCCATCT GTACAACGCG 
ATGCCGTATA TTACCGGTCG TGAACCGGGC CTGGCGGGCG CGATCCTCGA CGAAGCTGAC 
ATTTATTGCG GTATTATCGC TGATGGCCTG CATGTTGATT ACGCCAACAT TCGTAACGCT 
AAACGCCTGA AAGGCGACAA ACTGTGTCTG GTTACCGACG CCACCGCGCC AGCAGGTGCC 
AACATTGAAC AGTTCATTTT TGCGGGTAAA ACAATATACT ACCGTAACGG ACTTTGTGTG 
GATGAGAACG GTACGTTAAG CGGTTCATCC TTAACCATGA TTGAAGGCGT GCGTAATCTG 
GTCGAACATT GCGGTATCGC ACTGGATGAA GTGCTGCGTA TGGCGACGCT CTATCCGGCG 
CGTGCGATTG GCGTTGAGAA ACGTCTCGGC ACACTCGCCG CAGGTAAAGT AGCCAACCTG 
ACCGCATTCA CACCTGATTT TAAAATCACC AAGACCATCG TTAACGGTAA CGAGGTCGTA 
ACTCAATAA

Protein sequence

MYALTQGRIF TGHEFLDDHA VVIADGLIKS VCPVAELPPE IEQRSLNGAI LSPGFIDVQL 
NGCGGVQFND TAEAVSVETL EIMQKANEKS GCTNYLPTLI TTSDELMKQG VRVMREYLAK 
HPNQALGLHL EGPWLNLVKK GTHNPNFVRK PDAALVDFLC KNADVITKVT LAPEMVPAEV 
ISKLANAGIV VSAGHSNATL KEAKAGFRAG ITFATHLYNA MPYITGREPG LAGAILDEAD 
IYCGIIADGL HVDYANIRNA KRLKGDKLCL VTDATAPAGA NIEQFIFAGK TIYYRNGLCV 
DENGTLSGSS LTMIEGVRNL VEHCGIALDE VLRMATLYPA RAIGVEKRLG TLAAGKVANL 
TAFTPDFKIT KTIVNGNEVV TQ