Gene P9303_27141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_27141
Symbol	nagA
ID	4776889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	2392314
End bp	2393516
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	58%
IMG OID	640088237
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_001018709
Protein GI	124024402
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAA TGCCATGGTC CCGCACTAGC ACCACCTGGC CACCTCCCAT GCATCGGATC 
ACCCACATCC GCCTGCCCCA ACCTCTAAAT GCCATAGACA CCAAGCTGTG GTGGATGGCC 
GTAGATGAGC ACGAGCGGGT GCTCAGTGTT CAACCCATGG CAGATGGCTC TGCCATGGAC 
GGGGAGAGCT GGCAGGGCGA CTGGATCAGT CCCATGGGCA TCGATCTACA AATCAATGGA 
GGGCTGGGAT TGGCCTTCCC CGAGCTCACC GCCAAAGACA TTCCCCAGCT CCTGAAGCTG 
CTCGACAGAC TCTGGCAAGA CGGTGTACAG GCAATCTGCC CCACGCTTGT GAGCTGCGGC 
GTAGCAGCCC TGCGTCAATC TTTAACGGTG CTGCATGCAG CCCGAGAACA ACACTGCCCG 
CAACGCTGTG AACTACTAGG GGCCCACCTT GAAGGCCCTT TTCTGGCAAT GGCACGCCAC 
GGCGCCCATC CCCTGGAGCA TCTCTGTGCT CCGAGCCTAA GGGCACTGGA TGAACGCATT 
CGCGGCTTTG AACAAGACAT CAGTCTGATG ACCCTGGCTC CAGAACTGCC CGGATCCTCT 
GAAGTGATTG AACGACTAAG GACCCTAGAC ATCGTGGTAT GCCTAGGGCA CTCGAACGCA 
GATGGGGAAG CCTCTGCCGA TGCCTTCTCC CAGGGAGTGG GAATGCTGAC CCACTCCTTC 
AATGCCATGC CCGGTCTTCA TCATCGTGCA GCTGGCCCGG TGGGGGAAGC CTGCATGCAT 
GGAGAGATCG CTATGGGACT GATCGCCGAT GGCGTTCATG TTGACCCCAC CATGGCGGTG 
CTATTGCAAA GACTGGCACC ACAACAGCTG GTACTTGTGA GCGATAGTCT CGCTCCCTAC 
GGCCTCAAAG ATGGCAAATA TCGCTGGGAT GAAAGAGTTC TGCTGGTCGA AAAAGGAACC 
TGTCGTTTGG AAGATGGCAC TCTGGCAGGA GTCACACTGC CCCTCCTGGA AGGGAGTCGA 
CGTTTAGCCA CTTGGAGTGG TGAACCTGCC GCGGCCATCT GGGCTGCCAC CATGGCCCCT 
CGTCAGGTGA TGGGCAATGG CCGCACACTG GATGAGCTAC TTGTGAATCA GCCCTTAACA 
GACTTACTCC GCTGGCAGTG GAAACCGGAT ACTGAAGAGC TGATCTGGAA GCATGCTGCT 
TAA

Protein sequence

MTTMPWSRTS TTWPPPMHRI THIRLPQPLN AIDTKLWWMA VDEHERVLSV QPMADGSAMD 
GESWQGDWIS PMGIDLQING GLGLAFPELT AKDIPQLLKL LDRLWQDGVQ AICPTLVSCG 
VAALRQSLTV LHAAREQHCP QRCELLGAHL EGPFLAMARH GAHPLEHLCA PSLRALDERI 
RGFEQDISLM TLAPELPGSS EVIERLRTLD IVVCLGHSNA DGEASADAFS QGVGMLTHSF 
NAMPGLHHRA AGPVGEACMH GEIAMGLIAD GVHVDPTMAV LLQRLAPQQL VLVSDSLAPY 
GLKDGKYRWD ERVLLVEKGT CRLEDGTLAG VTLPLLEGSR RLATWSGEPA AAIWAATMAP 
RQVMGNGRTL DELLVNQPLT DLLRWQWKPD TEELIWKHAA