Gene A9601_00031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00031
Symbol	purF
ID	4716685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	4425
End bp	5885
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	33%
IMG OID	640077700
Product	amidophosphoribosyltransferase
Protein accession	YP_001008398
Protein GI	123967540
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0034] Glutamine phosphoribosylpyrophosphate amidotransferase
TIGRFAM ID	[TIGR01134] amidophosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.486133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCGGAA TAGTTGGAAT CGTTTCTTCG AATGATGTAA ATCAACAAAT TTACGATAGT 
CTTTTGCTTC TGCAGCATAG AGGTCAAGAC TCAACAGGGA TAGCAACAAT GGAAAATACT 
GTTTTCCATA TACATAAGGT TAAAGGTCAG GTTAATACTG CTTATAGAAC TAGAGATATG 
AGGAATTTAA TTGGCAAAAT TGGATTGGGT CATGTTAGGT ATGCAACTAA GGGATCAGCA 
GAAAGTGTAG AAGAAGCACA GCCTTTTTAT GTTAATGCTC CTTATGGAAT TGTTTTGATA 
CATAACGGAA ATTTGACTAA TACCAGAGAT TTAGAAAAAC AGTTATTTAA TGTGGACAAG 
CGGCATACAA ATTCTTCAAG TGATACTGAA ATGTTGTTAA ATGTATTTGC GACAGAATTA 
CAAGAACAAA TTCATAATCA AGAATTAGAA CCTGATATTA TTTTTAGTGC GGTCAAATCT 
TTACATAAAA GAATTCAGGG ATCATATGCT TCAATTGCAT TAATTTCAGG ACATGGTTTA 
TTGGCATTTA GAGATCCTTT TGGGATAAGG CCTTTAGTCA TAGGGAAAAG ACTTTCCTTA 
ACCACAAAAA AAGAAGAATG GATGGTTGCA AGCGAATCTT TAGTACTTGA GAATAATGAT 
TATCAAGTAG TGAGAGATGT AGATCCAGGA GAAGCTGTTT TTATAAATCT TGATGGGGAG 
TTTTTCTCTA AGCAATGTTC TGATAATCCC ATGCTATTTC CCTGTGCTTT TGAATATGTT 
TACTTAGCAA GGCCAGATTC AATTATGAAT GGAATTTCCG TTTATAAAGC TCGTTTAAAG 
ATGGGAGATT ATTTAGCAGA AACAATAAAA GAAACAATTA ATTCTGGAGA TATTGATGTA 
GTTATGCCTA TTCCTGATTC TTCTCGACCT GCGGCAATGC AAGTTGCAAG ACAGTTAGGG 
ATAGAATATA GGGAAGGTTT TTTTAAAAAT AGATATGTTG GCAGAACATT TATAATGCCT 
GGTCAGCAGA AACGTAAGAA ATCTGTAAGG CAAAAATTAA ATGCTATGAG TGCAGAGTTT 
AAAAATAAAA ATGTATTAAT TGTTGATGAC TCGATAGTAA GAGGTACTAC TTCAAAAGAA 
ATTGTGCAGA TGGCTAAAGA TGCAGGAGCA AACAAAGTTT TTTTTACATC AGCAGCTCCT 
CCTGTTCGTT ATCCTCACGT TTATGGAATT AATATGCCTA ATAGAGATGA ATTAATAGCA 
CATAATAGGA CAATAAGTGA AATCGCCGAT AAACTTGAAA TTGATAATCT TGTTTATCAA 
AGTGTTGAAA GTTTGCGTAA ATCTATAATT AGTGATTCTC CTATTAAAGG TTTAGAGATG 
AGTTGTTTCA CTGGTGATTA TGTAACTGGA ACAGTAAATC AAGAATACTT AAATTGGGTT 
GAAAATGAAT ATAAATCTTA G

Protein sequence

MCGIVGIVSS NDVNQQIYDS LLLLQHRGQD STGIATMENT VFHIHKVKGQ VNTAYRTRDM 
RNLIGKIGLG HVRYATKGSA ESVEEAQPFY VNAPYGIVLI HNGNLTNTRD LEKQLFNVDK 
RHTNSSSDTE MLLNVFATEL QEQIHNQELE PDIIFSAVKS LHKRIQGSYA SIALISGHGL 
LAFRDPFGIR PLVIGKRLSL TTKKEEWMVA SESLVLENND YQVVRDVDPG EAVFINLDGE 
FFSKQCSDNP MLFPCAFEYV YLARPDSIMN GISVYKARLK MGDYLAETIK ETINSGDIDV 
VMPIPDSSRP AAMQVARQLG IEYREGFFKN RYVGRTFIMP GQQKRKKSVR QKLNAMSAEF 
KNKNVLIVDD SIVRGTTSKE IVQMAKDAGA NKVFFTSAAP PVRYPHVYGI NMPNRDELIA 
HNRTISEIAD KLEIDNLVYQ SVESLRKSII SDSPIKGLEM SCFTGDYVTG TVNQEYLNWV 
ENEYKS