Gene P9211_01851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_01851
Symbol	nagA
ID	5731705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	177014
End bp	178165
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	40%
IMG OID	641284529
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001550070
Protein GI	159902726
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTGGA TTAATAATAT TCGTTTACCA ACTCCTTTCA CGGCTAATGC AGATTGCTGT 
TGGTCTGTTT TATTAGATTC AAGGGATATT GTTCGATCAA TTGAGCCAAG CTCTAGCTCA 
ATTGATAAGG AGGAGAATTG GCATGGAGAT TGGTTGAGTC CAATGGGTCT CGATCTTCAA 
ATCAATGGGG GGCTAGGGGT TTCGTTTAAT GCTCTTGATC GCGAGGATTT GCCAAATATT 
AATAAGTTAC TTGATCGCCT ATGGATGGAA GGTGTTGATG AGATATGTCC GACAATAGTG 
ACATGCAGTC TTTCTTCATT AAGGAAGTCC TTGGGAGTAT TACACCAGGC CCGTAAAAGA 
GTCTCAGATA AGTCATGCAG GCTCATTGGT GCTCATCTAG AAGGCCCTTT CTTATCAAGG 
GATTATGTTG GAGCTCATGA CTCGGATTTC CTCATCAATC CTACGCTTTC TTCTTTACAT 
GAGCGAATTC AAGAGTTTGA GACTGAAATA GCGATTGTTA CGCTTGCTCC AGAACTTTTG 
GGGTCTTTCG AAGTTGTTCA AAAATTAATA GATCTTGGGG TTGTGGTTTC TTTAGGCCAC 
TCGGGGGCTG ATGCTGAATT GAGTTCATTA GCATTTGACC ATGGGGTCAG CATGATTACT 
CATGCTTTTA ATGCTATGCC GGGTATTCAT CATAGATCTC CCGGACCTTT AGGTGAAGCC 
ATCGCAAATG GTGATATTTC AATTGGTTTA ATCGCCGATG GTATACATGT TCACCCAAAG 
GTCTTAAAAA TATTGCAGAA ACTTGCTCCA GAAAAGATTG TTTTAGTTAG CGATGCTCTA 
AGTCCATATG GTCTTGCTCA AGAAAAATTT CAATGGAATG ATCGATCATT AATAGTAAAA 
AACAATTTTT GCTCGCTTGA GGATGGCACT TTAGTAGGAA CGACTTTGTC ATTATTGGCT 
GCTTGTAAGC GTTTTGCTAA GTGGACAAAT CAGAATTCCG CTGCCATTTG GTCTGCAACG 
GTTGCTCCGC GCATTGCTTT GAATAAAGGA GATACTGTTC AAGATTTTCT TGTTGGAAAA 
TCATTAAATC AATTGTTGAG ATGGAACCTA GATATTGAGT CTGAAGAGTT AACTTGGAAT 
CATGCTAAGT AG

Protein sequence

MHWINNIRLP TPFTANADCC WSVLLDSRDI VRSIEPSSSS IDKEENWHGD WLSPMGLDLQ 
INGGLGVSFN ALDREDLPNI NKLLDRLWME GVDEICPTIV TCSLSSLRKS LGVLHQARKR 
VSDKSCRLIG AHLEGPFLSR DYVGAHDSDF LINPTLSSLH ERIQEFETEI AIVTLAPELL 
GSFEVVQKLI DLGVVVSLGH SGADAELSSL AFDHGVSMIT HAFNAMPGIH HRSPGPLGEA 
IANGDISIGL IADGIHVHPK VLKILQKLAP EKIVLVSDAL SPYGLAQEKF QWNDRSLIVK 
NNFCSLEDGT LVGTTLSLLA ACKRFAKWTN QNSAAIWSAT VAPRIALNKG DTVQDFLVGK 
SLNQLLRWNL DIESEELTWN HAK