Gene Mext_2566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2566
Symbol
ID	5832209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	2881522
End bp	2883120
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	70%
IMG OID	641368367
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001640031
Protein GI	163851988
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGCG ACCAGATCCG GGTCACCCGC GCCCTCCTTT CCGTTTCGGA CAAGACCGGG 
CTCACGGACT TCGCTGCGGC GCTGAGCCAG CGCGGCGTCG AACTCGTCTC GACCGGCGGC 
ACCCACCGCG CGTTGACCGA AGCGGGTCTC GCCGTCCGGG AAGTCTCAGA GCTGACGCGC 
TTCCCCGAGA TGATGGACGG CCGGGTGAAG ACGCTGCATC CGGCGGTTCA TGGCGGCCTG 
CTCGCGGTGC GCGACAACCC CGAGCATCAG GCGGCTTTGG CCGCCCACGG CATCGGCGCG 
ATCGACCTGC TCGTGGTCAA CCTCTACCCG TTCGAGGAAA CACTGAAGGC CGGCAAGGCC 
TATGACGACT GCGTCGAGAA CATCGATGTC GGCGGCCCGG CGATGATCCG CGCGGCGGCC 
AAGAACCATG CCGACGTCGC CGTGGTGGTG GATGTCTCGG ACTACGGCGC CATCCTCGCC 
GAACTCGCGG AGCATGACGG CAACCTCACC GCCACCACCC GCCGCAGGCT GGCGCAGAAG 
GCGTTTTCGC GTACCGCCTC CTACGACGCG GCGATCGCCA ACTGGCTCGC CGAGGTCGAG 
GGACGCGACA AGGCCCCGAC CTTCAAGGCG CTCGGTGGAA CGCTCGCCCA GAGCCTGCGC 
TACGGCGAGA ACCCGCACCA GTCGGCCGCC TTCTATCGCC TGCCCGGCAC CCTGCGCCCC 
GGCATCGCCA CCGCCCGGCA GGTCCAGGGC AAGGAACTGT CCTACAACAA CCTCAACGAC 
ACCGATGCGG CCTACGAATG CGTCGCCGAG TTCGACCCGG CACGCACGGC GGCGGTCGCG 
ATCATCAAGC ACGCCAACCC CTGCGGCGTC GCGGAAGGGC CGGATTTGCT AGCGGCTTAC 
GAGCAGGCGC TGGCCTGCGA TCCGACCTCG GCCTTCGGCG GTATCGTCGC CCTCAACCGG 
CCTCTCGACG CCGAGGCCGC GAGAAAGATC GTCGAGATCT TCACCGAGGT CATCATCGCC 
CCCGACGCCT CCGAGGAGGC GCTCGCTATC GTCGGCGCCA AGAAGAACCT GCGGCTTCTG 
CTCGCCGGCG GCCTCGCCGA TCCGCGGGCG AAGGGCGAGG TCATCCGCAC CGTGGCGGGC 
GGCTTCCTGG TCCAGGGCCG GGATGCGCTC AGCGTGGACG ACATGGACCT GAAGGTCGTA 
ACCAAGCGCG CCCCGAGCGA GGCGGAACTC GCCGACATGC GCTTTGCCTA TCGGGTGGCC 
AAGCACGTGA AGTCGAACGC CATCGTCTAC GCCAAGGGCG GCGCCACGGT CGGCATCGGC 
GCCGGGCAGA TGTCGCGGGT GGATTCCTCG ATCACCGCCG CGCGCAAGGC GGCGGAAGCG 
GCGCAGCGCC TCGGCCTGTC CGAGAGCCTC GCCAAGGGTT CGGCGGTGGC CTCCGACGCC 
TTCTTCCCTT TCGCCGACGG CCTGCTCGCC GCCGCCGAGG CCGGTGCCAC CGCCGTGATC 
CAGCCCGGCG GCTCGATGCG CGACGACGAG GTGATCCGGG CCGCCGACGA GGCCGGGCTC 
GCCATGGTGT TCACCGGCGT GCGCCACTTC CGGCACTAG

Protein sequence

MPRDQIRVTR ALLSVSDKTG LTDFAAALSQ RGVELVSTGG THRALTEAGL AVREVSELTR 
FPEMMDGRVK TLHPAVHGGL LAVRDNPEHQ AALAAHGIGA IDLLVVNLYP FEETLKAGKA 
YDDCVENIDV GGPAMIRAAA KNHADVAVVV DVSDYGAILA ELAEHDGNLT ATTRRRLAQK 
AFSRTASYDA AIANWLAEVE GRDKAPTFKA LGGTLAQSLR YGENPHQSAA FYRLPGTLRP 
GIATARQVQG KELSYNNLND TDAAYECVAE FDPARTAAVA IIKHANPCGV AEGPDLLAAY 
EQALACDPTS AFGGIVALNR PLDAEAARKI VEIFTEVIIA PDASEEALAI VGAKKNLRLL 
LAGGLADPRA KGEVIRTVAG GFLVQGRDAL SVDDMDLKVV TKRAPSEAEL ADMRFAYRVA 
KHVKSNAIVY AKGGATVGIG AGQMSRVDSS ITAARKAAEA AQRLGLSESL AKGSAVASDA 
FFPFADGLLA AAEAGATAVI QPGGSMRDDE VIRAADEAGL AMVFTGVRHF RH