Gene P9211_17101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_17101
Symbol	purM
ID	5730170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1536694
End bp	1537731
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	41%
IMG OID	641286093
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001551595
Protein GI	159904251
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.199826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACA AGACAGCTGG AGTTGATGTG AAAGCGGGTA GAGCCTTTGT TGATTTGATT 
AAAACAAGTG TCAATGAAAC CTCTCGCCCA GAAGTGATTG GTGGAATCGG AGGATTTGGT 
GGCTTTATGC GTTTACCGCA TGGTTTGGAG AATCCTGTCT TGGTTGCTGG AACAGATGGT 
GTTGGTACCA AACTCGAGTT AGCACAGGAT TATCACGCTC ATTTTGGAGT GGGTATCGAC 
TTAGTTGCTA TGTGTGTAAA TGATGTGATT ACTAGTGGTG CTGAACCATT ACTTTTTCTT 
GACTATATAG CTACTGGAAA GCTTGCCCCA AAAGACTTGT CTGAAGTTGT AAAAGGTATT 
GCAGAAGGCT GTAAAAAGTC TAACTGTGTT CTCTTAGGTG GAGAAACCGC AGAGATGCCT 
GGGTTTTATT CAAAAGGTCG TTATGACTTG GCTGGCTTCT GTTTGGCTGT GGTGGAAGAA 
AAAAAGATTA TTGATGGGAG CACAATTAAA GCTGGTGATC AGATTATTGG TGTTCAAAGC 
AATGGACTAC ATAGCAATGG ATTCAGCCTT GTACGAAAAG TTCTTGGAAT GTCTGGTGCA 
AATAAGTCAA TTTTGGTTGA CACAAAGAAA ACCCCTTTAA TTGACTCCTT ATTACAGCCG 
ACCGCTTTAT ATGTTGAATT AGTTCAGAGC CTTCTTAAAC ACACTATTCC TATTAAGGGA 
ATGGCCCATA TTACAGGAGG TGGTTTGCCA GAAAATTTGC CTAGGTGCTT ACCTAATGGG 
TTAAATGCTT TTATTGAACC TGGTAGTTGG GATATTCCAG AAATTTTCTT CTGGTTAAAA 
AAAGCAGGAC ATATTCCAGA AGATGATTGG TGGAATACTT TTAACTTAGG TATTGGTTTT 
TGTTTAGTGG TTTCAACTGA TCAAGTTGAA GCAGCATTGG AAATATGCAC AGAAATTGGC 
TGGGATGCAT GGACCATTGG TCGAGTTCAA GAACCCACTG TTCCAGGGCA GCAACGATTG 
ATAGGTCTTC CTGAGTAG

Protein sequence

MDYKTAGVDV KAGRAFVDLI KTSVNETSRP EVIGGIGGFG GFMRLPHGLE NPVLVAGTDG 
VGTKLELAQD YHAHFGVGID LVAMCVNDVI TSGAEPLLFL DYIATGKLAP KDLSEVVKGI 
AEGCKKSNCV LLGGETAEMP GFYSKGRYDL AGFCLAVVEE KKIIDGSTIK AGDQIIGVQS 
NGLHSNGFSL VRKVLGMSGA NKSILVDTKK TPLIDSLLQP TALYVELVQS LLKHTIPIKG 
MAHITGGGLP ENLPRCLPNG LNAFIEPGSW DIPEIFFWLK KAGHIPEDDW WNTFNLGIGF 
CLVVSTDQVE AALEICTEIG WDAWTIGRVQ EPTVPGQQRL IGLPE