Gene NATL1_18651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_18651
Symbol	purB
ID	4780294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1522143
End bp	1523438
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	38%
IMG OID	640085154
Product	adenylosuccinate lyase
Protein accession	YP_001015685
Protein GI	124026570
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.537762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTGAGC GTTACACAAA CCCAGAGATG GGAAATATTT GGTCTGATCA AGCCAAATAC 
CAAACATGGC TTGATGTTGA AATTGCCGCA TGTGAGGCTA ATTGCAAATT AGGGAAAATC 
CCTCAAAGTG CAATGGAAAC AATTCGAACA AAGGCAAGAT TCAAGCCAGA ACGCATACTC 
GAAATAGAGG AGGAAGTTCG CCATGACGTA ATTGCCTTTC TAACAAATGT AAATGAATAT 
GTTGGGGATG CTGGCCGTTA CATTCACGTT GGAATGACCA GTAGCGATGT CCTTGATACT 
GGTCTTGCAC TGCAATTAAA GTCATCCGTC AAACTTTTAA GAAAAGAGCT TTTATTACTT 
GAAGAAGCTA TTAGAGATTT AGCAAGTCAG CATAAAAAAA CCGTAATGAT TGGACGTTCT 
CATGCCATTC ATGGAGAACC TATTACCTTT GGATTCAAGT TGGCGGGATG GCTAGCTGAA 
ACTCTCAGGA ACAAAGATAG GCTAAACAGT CTTGAGAAAG ATATTTCTGT TGGTCAAATC 
AGCGGAGCTA TGGGCACTTA TGCCAATACT GATCCAGAAA TAGAAAAAAT AACTTGCGAA 
CTTTTGGAGC TTGATTGTGA CACTGCTAGC ACTCAAGTTA TCTCAAGAGA TAGGCATGCT 
AATTATGTGC AGATTCTTGC TTTGATTGGA TCTTCACTAG ATCGTTTTTC TACAGAAATT 
AGAAACCTTC AAAGAACTGA TGTTCTTGAA GTAGAGGAAA ACTTTGCTAA AGGCCAAAAA 
GGAAGCTCTG CAATGCCTCA TAAAAGAAAT CCTATACGTA GTGAACGGGT AAGTGGGCTT 
TCCAGGGTTT TAAGAAGTTA TGTAGTTGCA GCTCTTGAAA ATGTAGCCCT ATGGCACGAA 
AGAGATATAA GCCACAGCTC CAATGAAAGA TTAATGCTGC CAGACACATC TATTACTCTT 
CATTTCATGC TCACAGAAAT GACCGCAATA ATTAAAGGTC TTGGAGTATA TCCAAATAAT 
ATGCTGAAAA ATTTGAACAT TTATGGAGGA GTAGTGTTTA GTCAAAGAGT ACTTTTGGCT 
TTAGTTGAGA ATGGAATGAG TAGAGAAGAT TCTTATAGAT TAGTTCAAAA AAATGCTCAT 
TCAGCCTGGA ATCAACCCGA AGGAAATTTC AAAAAGAACC TTGAGAATGA CCCAGAGGTA 
ATGAATAGTC TCTCTACTGA AAAACTCTCT GATTGCTTCT CAACCGAATT ACATCAATCA 
AATTTGAGAG TTATTTGGGA AAGACTTGGC ATATAA

Protein sequence

MIERYTNPEM GNIWSDQAKY QTWLDVEIAA CEANCKLGKI PQSAMETIRT KARFKPERIL 
EIEEEVRHDV IAFLTNVNEY VGDAGRYIHV GMTSSDVLDT GLALQLKSSV KLLRKELLLL 
EEAIRDLASQ HKKTVMIGRS HAIHGEPITF GFKLAGWLAE TLRNKDRLNS LEKDISVGQI 
SGAMGTYANT DPEIEKITCE LLELDCDTAS TQVISRDRHA NYVQILALIG SSLDRFSTEI 
RNLQRTDVLE VEENFAKGQK GSSAMPHKRN PIRSERVSGL SRVLRSYVVA ALENVALWHE 
RDISHSSNER LMLPDTSITL HFMLTEMTAI IKGLGVYPNN MLKNLNIYGG VVFSQRVLLA 
LVENGMSRED SYRLVQKNAH SAWNQPEGNF KKNLENDPEV MNSLSTEKLS DCFSTELHQS 
NLRVIWERLG I