Gene MmarC7_0618 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MmarC7_0618
Symbol	purP
ID	5328502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcus maripaludis C7
Kingdom	Archaea
Replicon accession	NC_009637
Strand	-
Start bp	622817
End bp	623902
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	39%
IMG OID	640793143
Product	5-formaminoimidazole-4-carboxamide-1-(beta)-D- ribofuranosyl 5'-monophosphate synthetase
Protein accession	YP_001329836
Protein GI	150402542
COG category	[R] General function prediction only
COG ID	[COG1759] ATP-utilizing enzymes of ATP-grasp superfamily (probably carboligases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCAA AAGAAGAAAT AATGGGGATT TTTGAAAAGT ACAACAAGGA CGAAGTGACT 
ATCGTTACGG TGGGCAGTCA CACGTCCTTG CACATCTTAA AAGGTGCAAA ATTGGAGGGC 
TTTTCAACTG CAGTTATAAC AACAAGGGAT AGGGACATTC CGTACAAAAG ATTTGGGGTT 
GCGGACAAAT TTATCTATGT TGACAAATTT TCAGATATTT CAAAAGAAGA AATTCAACAG 
CAATTAAGGG ATATGAATGC AATTATTGTT CCACACGGTT CGTTTATAGC TTATTGTGGT 
TTAGATAATG TGGAAGATAC ATTCAAAGTT CCAATGTTTG GAAACAGGGC TATTTTAAGA 
TGGGAGGCTG AAAGAGATCT CGAAGGACAG CTTTTGGGCG GAAGCGGCCT TAGAATCCCT 
AAAAAATACG GTGGACCTGA TGACATAGAT GGGCCAGTAA TGGTTAAATT CCCTGGAGCA 
AGGGGTGGCA GAGGATACTT CCCATGCTCA ACTGTGGAAG AATTCTGGAG AAAAATAGAC 
GAATTCAAAG CTAAAGGTAT TCTTACAGAA GACGATGTTG CAAAAGCACA CATCGAAGAA 
TATGTTGTTG GTGCAAACTA CTGTATTCAC TACTTCTATT CACCATTAAA AGACCAGGTT 
GAATTAATGG GTATTGATAG AAGATATGAA AGCAGTATTG ATGGACTTGT TAGGGTTCCT 
GCAAAAGACC AGCTTGAATT AAGCATTGAC CCATCATACG TTATCACAGG AAACTTCCCT 
GTTGTAATCA GAGAAAGTCT CTTGCCTCAA GTATTTGACA TGGGTGACAA ATTAGCAACA 
AAAGCAAAAG AACTCGTAAA ACCGGGAATG CTTGGACCGT TCTGTTTACA GTCATTATGT 
AACGAAAACC TAGAACTCGT TGTATTCGAA ATGAGTGCAA GGGTAGATGG TGGAACAAAC 
ACGTTCATGA ACGGAAGCCC GTATTCATGC CTTTACACAG GAGAACCATT AAGCATGGGC 
CAGAGAATTG CAAGAGAAAT AAAATTAGCA CTCGAACTCA AAATGATTGA TAAAGTTATA 
TCTTAA

Protein sequence

MIPKEEIMGI FEKYNKDEVT IVTVGSHTSL HILKGAKLEG FSTAVITTRD RDIPYKRFGV 
ADKFIYVDKF SDISKEEIQQ QLRDMNAIIV PHGSFIAYCG LDNVEDTFKV PMFGNRAILR 
WEAERDLEGQ LLGGSGLRIP KKYGGPDDID GPVMVKFPGA RGGRGYFPCS TVEEFWRKID 
EFKAKGILTE DDVAKAHIEE YVVGANYCIH YFYSPLKDQV ELMGIDRRYE SSIDGLVRVP 
AKDQLELSID PSYVITGNFP VVIRESLLPQ VFDMGDKLAT KAKELVKPGM LGPFCLQSLC 
NENLELVVFE MSARVDGGTN TFMNGSPYSC LYTGEPLSMG QRIAREIKLA LELKMIDKVI 
S