Gene A9601_16671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_16671
Symbol	purB
ID	4718397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1407842
End bp	1409137
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	35%
IMG OID	640079393
Product	adenylosuccinate lyase
Protein accession	YP_001010057
Protein GI	123969199
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGAGC GTTACACATT ACCCAAAATG GGGAAAATCT GGACTGAAAG CGCAAAATTC 
CAGAGTTGGC TTAAGGTTGA AATAGCTGCA TGTGAAGCAA ATTTTTCCCT CGGGAAAATC 
CCTGAGAATG CCATGAAAGA GATACGTTCA AATGCAAAGT TTGATGAATC TAGAATCACA 
GAAATTGAGA AAGAAGTTAA ACATGATGTC ATAGCATTTC TTACAAGCGT TAATGAATTT 
GTAGGAGATT CAGGAAGATA CATACATGTT GGTATGACCA GTAGTGATGT ACTTGATACT 
GGCTTATCTC TTCAGTTAAA AGATTCTTGC GAATTGCTAT TAGAAGAAAT TGAGAACCTA 
GAAAATGAGG TCAGATTATT AGCAAGGAAG CATAAAAATA CATTAATGAT TGGCAGATCT 
CATGCAATTC ATGGGGAGCC AATTTCCTTC GGTTTTAAAC TTGCTGGATG GTTAGCAGAA 
ATAATAAGGA ACAAAAAAAG ATTGTTAACT CTGAAAGATT CTGTAGCAAT TGGACAAATA 
AGTGGTGCAA TGGGAACTTA CGCTAATACA AATCCTAAAG TAGAACAAAT AACTTGTGAT 
TTACTCGGCT TAAAACCTGA TACAGCAAGT ACGCAGGTTA TATCGAGAGA CAGACATGCA 
GAATATGTGC AAACTATTGC ACTAGTTGGA GCTTCTTTAG ATAGATTCGC GACTGAAATA 
AGAAATTTAC AAAGAACTGA TGTTTTAGAA GTTGAGGAGG GCTTTACAAA AGGGCAAAAA 
GGAAGTTCTG CCATGCCTCA TAAAAGAAAT CCTATTCGGA GTGAAAGGGT AAGTGGTTTA 
GCAAGAATTT TGAGGAGTTA TGTCTTAACC GCACTTGAAA ATGTTCCACT TTGGCACGAA 
AGAGATATAA GCCATAGTTC AAATGAACGT ATCATGCTAC CTGACGTATC AATCTGCTTG 
CATTTTATGC TCAGGGAAAT GCAAGATATA GTAAGCAATT TAGAAGTTTA TCCAAAAAAT 
ATGCTCAAAA ATTTAAATAT ATATGGTGGT GTAATCTTTA GTCAGAAAGT TTTACTTTTG 
CTTGTAGAAA AGGGATTGTC TAGAGAAAAA GCTTATAGCT TAGTGCAAAA AAATGCGCAT 
CAGGCCTGGA ACACGCAGAA TGGGAATTTC AAACAAAATA TAGAGGGCGA TAATGAAATT 
ATGGATTATA TTGATCAAAG TGACTTAGAA GAATGTTTTA ATCCTTCAAT TCATCTTAAT 
AATTTAAGTG TAATATGGGA GAAGTTAGGT ATCTAG

Protein sequence

MIERYTLPKM GKIWTESAKF QSWLKVEIAA CEANFSLGKI PENAMKEIRS NAKFDESRIT 
EIEKEVKHDV IAFLTSVNEF VGDSGRYIHV GMTSSDVLDT GLSLQLKDSC ELLLEEIENL 
ENEVRLLARK HKNTLMIGRS HAIHGEPISF GFKLAGWLAE IIRNKKRLLT LKDSVAIGQI 
SGAMGTYANT NPKVEQITCD LLGLKPDTAS TQVISRDRHA EYVQTIALVG ASLDRFATEI 
RNLQRTDVLE VEEGFTKGQK GSSAMPHKRN PIRSERVSGL ARILRSYVLT ALENVPLWHE 
RDISHSSNER IMLPDVSICL HFMLREMQDI VSNLEVYPKN MLKNLNIYGG VIFSQKVLLL 
LVEKGLSREK AYSLVQKNAH QAWNTQNGNF KQNIEGDNEI MDYIDQSDLE ECFNPSIHLN 
NLSVIWEKLG I