Gene NATL1_00351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00351
Symbol	guaA
ID	4780186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	35154
End bp	36740
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	37%
IMG OID	640083298
Product	GMP synthase
Protein accession	YP_001013864
Protein GI	124024748
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCAA TGATTTCAGC TGAAAAACGT AATCCAGCAA TTGTAATTCT CGATTTTGGT 
TCTCAATATT CAGAATTAAT TGCTCGAAGG ATTAGAGAGA CAGAGGTTTA CTCATTAGTT 
ATGAGTTACA CAACATCTGC TGACAAATTA CGTTCACTTA AGCCTAAGGG AATTATTTTA 
AGCGGAGGTC CTGGATCTGT TTATGAAGAA GGTGCTCCAT ATTGTGACCC AGAGATTTTT 
AATTTAGGAA TTCCTGTTCT TGGTGTTTGT TATGGAATGC AATTAATGGT TCATGAGCTA 
GGAGGATCTG TAAAACCTGC TACTGGGAAA GCCGAATATG GAAAGGCTCC TTTAGAAGTT 
GATGATCCAA CAGCGTTATT AACGAATGTT ATTAGTGGTT CAACAATGTG GATGAGTCAT 
GGTGATTCAG TTCAGAAATT ACCCAAAGGA TTTGTCAGAT TAGCTCATAC CTCGAATACT 
TTAGAGGCTG CTATTGCTTT GCATGATAAG AGCTTTTATG GAGTGCAATT TCATCCCGAA 
GTTGTTCATT CCACCCATGG AATGGTTGTA ATAAGAAATT TTGTATATGA TATTTGTTCT 
TGTGAGCCGG ATTGGACAAC AAATTTATTT ATAGATGAAG CTGTTTCTCA AGTGCAACAA 
CAGGTAGGCG ATAAAAAAGT TTTATTGGCT CTATCTGGTG GTGTTGATTC ATCAACTCTT 
GCATTTTTGT TAAACAAAGC AATAGGACCT CAATTGACGT GCATGTTTAT TGATCAAGGT 
TTTATGAGAA AAGGTGAGCC AGAATTTTTA ATGTCTTTTT TTGATGAAAA GTTCAAGATT 
AATGTTGAAT ACATCAATGC CAGAGAAAGA TTTATTTCAC AATTAAAAGG AGTAACTGAT 
CCTGAGCAAA AGCGTAAAAT TATAGGTAGA GAATTTATTC GGGTTTTTGA AGAAGAGAGT 
CTGCGATTAG GCCCTTTTGA TTACTTGGCT CAAGGTACGC TTTATCCAGA TGTAATTGAA 
AGTTCTGGAA CAAATATTGA TCCAAAAACT GGCGAACGAA TAGCGGTTAA AATTAAAAGT 
CATCATAATG TAGGAGGGTT GCCAAAAGAT TTGCAATTTA AATTGGTAGA GCCCTTGAGA 
CGTTTATTTA AAGATGAAGT CAGAAAAGTT GGTAAATCAC TGGGATTGCC AGATGAGATT 
GTTCGAAGAC ACCCATTTCC AGGTCCAGGA TTGGCTATAA GAATTTTAGG AGAGGTTACT 
CATGAGAAAC TAAATTGTTT AAGAGACGCA GATTTAATTG TCAGAGAGGA GATTAATAAT 
GCTGGCTTGT ATAACAAAAT TTGGCAGGCG TTCGCAGTTT TATTGCCTGT GTATTCAGTG 
GGAGTAATGG GAGATCAAAG AACTTATGCG TGGCCAATTG TTGTTCGTTG TGTTTCTAGT 
GAGGATGGGA TGACTGCTGA TTGGTCGCGT TTGCCGTATG CAGTTTTAGA GAAAATTTCT 
AACCGGATAG TTAACGAGGT CGAGGGAGTT AATAGAGTTG TTTTAGATAT AACAAGTAAA 
CCCCCAGGAA CTATTGAGTG GGAGTGA

Protein sequence

MASMISAEKR NPAIVILDFG SQYSELIARR IRETEVYSLV MSYTTSADKL RSLKPKGIIL 
SGGPGSVYEE GAPYCDPEIF NLGIPVLGVC YGMQLMVHEL GGSVKPATGK AEYGKAPLEV 
DDPTALLTNV ISGSTMWMSH GDSVQKLPKG FVRLAHTSNT LEAAIALHDK SFYGVQFHPE 
VVHSTHGMVV IRNFVYDICS CEPDWTTNLF IDEAVSQVQQ QVGDKKVLLA LSGGVDSSTL 
AFLLNKAIGP QLTCMFIDQG FMRKGEPEFL MSFFDEKFKI NVEYINARER FISQLKGVTD 
PEQKRKIIGR EFIRVFEEES LRLGPFDYLA QGTLYPDVIE SSGTNIDPKT GERIAVKIKS 
HHNVGGLPKD LQFKLVEPLR RLFKDEVRKV GKSLGLPDEI VRRHPFPGPG LAIRILGEVT 
HEKLNCLRDA DLIVREEINN AGLYNKIWQA FAVLLPVYSV GVMGDQRTYA WPIVVRCVSS 
EDGMTADWSR LPYAVLEKIS NRIVNEVEGV NRVVLDITSK PPGTIEWE