Gene EcE24377A_3617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3617
Symbol	nagA2
ID	5589127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3617674
End bp	3618807
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	58%
IMG OID	640927241
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001464610
Protein GI	157158122
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACACC TTCTGCGCGC CAGAAGGCTG CTGACTGAAG AGGGATGGCT CGATGACCAT 
CAGTTGCGTA TTGCTGACGG TGTCATCGCA GCAATCGAAC CGATTCCAGT GGGCGTGACT 
GAACGCGATG CGGAACTGCT CTGCCCCGCT TACATCGACA CCCATGTACA CGGTGGTGCG 
GGCGTTGATG TAATGGATGA CGCGCCGGAT GTACTCGACA AGCTGGCAAT GCACAAGGCA 
CGCGAAGGTG TCGGCAGTTG GTTGCCGACT ACCGTAACCG CGCCGCTTAA CAGCATTCAT 
GCGGCGCTGA AACGTATTGC TCAACGTTGC CAACGCGGCG GACCTGGTGC GCAAGTGCTG 
GGGAGTTATC TCGAAGGACC GTACTTCACG CCGCAGAATA AAGGCGCGCA TCCGCCGGAA 
TTGTTTCGCG AGCTTGAAAT TGCCGAGCTG GATCAATTGA TTGCCGTTTC TCAGCACACC 
TTACGCGTGG TAGCGCTGGC ACCGGAAAAA GAGGGGGCAT TGCAGGCCAT CCGCCATCTT 
AAACAGCAAA ATGTACGAGT GATGCTGGGG CATAGCGCGG CGACCTGGCA ACAAACTCGC 
GCCGCGTTTG ATGCTGGTGC CGACGGCCTG GTGCATTGCT ATAACGGGAT GACAGGTTTA 
CATCACCGCG AACCGGGAAT GGTTGGCGCG GGATTAACGG ACAAGCGCGC CTGGCTGGAA 
CTGATAGCCG ATGGTCATCA TGTGCATCCG GCGGCGATGT CGCTGTGTTG TTGCTGTGCA 
AAAGAGAGAA TCGTGCTGAT CACCGACGCG ATGCAGGCAG CCGGGATGCC GGATGGTCGC 
TATACGTTAT GTGGCGAAGA AGTGCAGATG CACGGTGGCG TTGTCCGTAC CGCGTCCGGT 
GGGCTGGCGG GCAGTACGCT GTCTGTTGAT GCGGCAGTGC GCAACATGGT CGAGTTGACG 
GGCGTAACGC CTGCGGAAGC CATTCATATG GCATCGCTGC ATCCGGCGCG AATGCTGGGT 
GTTGATGGTG TTCTGGGATC GCTTAAACCG GGCAAACGCG CCAGCGTCGT TGCGCTGGAT 
AGCGGGCTAC ATGTGCAACA AATCTGGATT CAGGGTCAAT TAGCTTCGTT TTGA

Protein sequence

MTHLLRARRL LTEEGWLDDH QLRIADGVIA AIEPIPVGVT ERDAELLCPA YIDTHVHGGA 
GVDVMDDAPD VLDKLAMHKA REGVGSWLPT TVTAPLNSIH AALKRIAQRC QRGGPGAQVL 
GSYLEGPYFT PQNKGAHPPE LFRELEIAEL DQLIAVSQHT LRVVALAPEK EGALQAIRHL 
KQQNVRVMLG HSAATWQQTR AAFDAGADGL VHCYNGMTGL HHREPGMVGA GLTDKRAWLE 
LIADGHHVHP AAMSLCCCCA KERIVLITDA MQAAGMPDGR YTLCGEEVQM HGGVVRTASG 
GLAGSTLSVD AAVRNMVELT GVTPAEAIHM ASLHPARMLG VDGVLGSLKP GKRASVVALD 
SGLHVQQIWI QGQLASF