Gene SbBS512_E0574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0574
Symbol	nagA
ID	6269957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	551109
End bp	552257
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	641724778
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001879325
Protein GI	187733720
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.731275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGCAT TAACCCAGGG CCGGATCTTT ACCGGCCACG AATTTCTTGA TGACCACGCG 
GTTGTTATCG CTGATGGCCT GATTAAAAGC GTCTGTCCGG TAGCGGAACT GCCGCCAGAG 
ATCGAACAAC GTTCACTGAA CGGGGCCATT CTCTCCCCCG GTTTTATCGA TGTGCAGTTA 
AACGGCTGCG GCGGCGTACA GTTTAACGAC ACCGCTGAAG CGGTCAGCGT GGAAACGCTG 
GAAATCATGC AGAAAGCCAA TGAGAAATCA GGCTGTACTA ACTATCTGCC GACGCTTATC 
ACCACCAGCG ATGAGCTGAT GAAACAGGGC GTGCGCGTTA TGCGCGAGTA CCTGGCAAGA 
CATCCGAATC AGGCGTTAGG TCTGCATCTG GAAGGTCCGT GGCTGAATCT GGTAAAAAAA 
GGCACCCATA ATCCGAATTT TGTGCGTAAG CCTGATGCCG CGCTGGTCGA TTTCCTGTGT 
GAAAACGCCG ACGTCATTAC CAAAGTGACC CTGGCACCGG AAATGGTTCC TGCGGAAGTC 
ATCAGCAAAC TGGCAAATGC CGGGATTGTG GTTTCTGCCG GTCACTCCAA CGCGACGTTG 
AAAGAAGCGA AAGCCGGTTT CCGCGCGGGG ATTACCTTTG CCACCCATCT GTACAACGCG 
ATGCCGTATA TTACCGGTCG TGAACCGGGC CTGGCGGGCG CGATCCTCGA CGAAGCTGAC 
ATTTATTGCG GTATTATCGC TGATGGCCTG CATGTTGATT ACGCCAACAT TCGTAACGCT 
AAACGCCTTA AAGGCGACAA ACTGTGTCTG GTTACCGACG CCACCGCGCC AGCAGGTGCC 
AACATTGAAC AGTTCATTTT TGCGGGTAAA ACAATATACT ACCGTAACGG ACTTTGTGTG 
GATGAGAACG GTACGTTAAG CGGTTCATCC TTAACCATGA TTGAAGGCGT GCGTAATCTG 
GTCGAACATT GCGGTATCGC ACTGGATGAA GTGCTGCGTA TGGCGACGCT CTATCCGGCG 
CGTGCGATTG GCGTTGAGAA ACGTCTCGGC ACACTCGCCG CAGGTAAAGT AGCCAACCTG 
ACCGCATTCA CACCTGATTT TAAAATCACC AAGACCATCG TTAACGGTAA CGAGGTCGTA 
ACTCAATAA

Protein sequence

MYALTQGRIF TGHEFLDDHA VVIADGLIKS VCPVAELPPE IEQRSLNGAI LSPGFIDVQL 
NGCGGVQFND TAEAVSVETL EIMQKANEKS GCTNYLPTLI TTSDELMKQG VRVMREYLAR 
HPNQALGLHL EGPWLNLVKK GTHNPNFVRK PDAALVDFLC ENADVITKVT LAPEMVPAEV 
ISKLANAGIV VSAGHSNATL KEAKAGFRAG ITFATHLYNA MPYITGREPG LAGAILDEAD 
IYCGIIADGL HVDYANIRNA KRLKGDKLCL VTDATAPAGA NIEQFIFAGK TIYYRNGLCV 
DENGTLSGSS LTMIEGVRNL VEHCGIALDE VLRMATLYPA RAIGVEKRLG TLAAGKVANL 
TAFTPDFKIT KTIVNGNEVV TQ