Gene B21_00625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00625
Symbol	nagA
ID	8112691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	660885
End bp	662033
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	644846898
Product	hypothetical protein
Protein accession	YP_002998471
Protein GI	251784167
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.386862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGCAT TAACCCAGGG CCGGATCTTT ACCGGCCACG AATTTCTTGA TGACCACGCG 
GTTGTTATCG CTGATGGCCT GATTAAAAGC GTCTGTCCGG TAGCGGAACT GCCGCCAGAG 
ATTGAACAAC GTTCACTGAA CGGGGCCATT CTCTCCCCCG GTTTTATCGA TGTGCAGTTA 
AACGGCTGCG GCGGCGTGCA GTTTAACGAT ACCGCAGAGG CGGTCAGCGT AGAAACGCTG 
GAAATCATGC AGAAAGCCAA TGAGAAATCA GGCTGTACTA ACTATCTGCC GACGCTTATC 
ACCACCAGCG ATGAGCTGAT GAAACAGGGC GTGCGCGTTA TGCGCGAGTA CCTGGCAAAA 
CATCCGAATC AGGCGTTAGG TCTGCATCTG GAAGGTCCGT GGCTGAATCT GGTAAAAAAA 
GGCACCCATA ATCCGAATTT TGTGCGTAAG CCTGATGCCG CGCTGGTCGA TTTCCTGTGT 
GAAAACGCCG ACGTCATTAC CAAAGTGACC CTGGCACCGG AAATGGTTCC TGCGGAAGTC 
ATCAGCAAAC TGGCAAATGC CGGGATTGTG GTTTCTGCCG GTCACTCCAA CGCGACGTTG 
AAAGAAGCGA AAGCCGGTTT CCGCGCGGGG ATTACCTTTG CCACCCATCT GTACAACGCG 
ATGCCGTATA TTACCGGTCG TGAACCGGGC CTGGCGGGCG CGATCCTCGA CGAAGCTGAC 
ATTTATTGCG GTATTATCGC TGATGGCCTG CATGTTGATT ACGCCAACAT TCGCAACGCT 
AAACGTCTGA AAGGCGACAA ACTGTGTCTG GTTACTGACG CCACCGCACC AGCAGGTGCC 
AACATTGAAC AGTTCATTTT TGCGGGTAAA ACAATATACT ACCGTAACGG ACTTTGTGTG 
GATGAGAACG GTACGTTAAG CGGTTCATCC TTAACCATGA TTGAAGGCGT GCGTAATCTG 
GTCGAACATT GTGGTATCGC ACTGGATGAA GTGCTGCGTA TGGCGACGCT CTATCCGGCG 
CGTGCGATTG GCGTTGAGAA ACGTCTCGGT ACACTCGCCG CAGGTAAAGT AGCCAACCTG 
ACTGCATTCA CACCTGATTT TAAAATCACC AGGACCATCG TTAACGGTAA CGAGGTCGTA 
ACTCAATAA

Protein sequence

MYALTQGRIF TGHEFLDDHA VVIADGLIKS VCPVAELPPE IEQRSLNGAI LSPGFIDVQL 
NGCGGVQFND TAEAVSVETL EIMQKANEKS GCTNYLPTLI TTSDELMKQG VRVMREYLAK 
HPNQALGLHL EGPWLNLVKK GTHNPNFVRK PDAALVDFLC ENADVITKVT LAPEMVPAEV 
ISKLANAGIV VSAGHSNATL KEAKAGFRAG ITFATHLYNA MPYITGREPG LAGAILDEAD 
IYCGIIADGL HVDYANIRNA KRLKGDKLCL VTDATAPAGA NIEQFIFAGK TIYYRNGLCV 
DENGTLSGSS LTMIEGVRNL VEHCGIALDE VLRMATLYPA RAIGVEKRLG TLAAGKVANL 
TAFTPDFKIT RTIVNGNEVV TQ