Gene Mchl_2789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2789
Symbol
ID	7114856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	2941296
End bp	2942894
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	70%
IMG OID	643525537
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002421556
Protein GI	218530740
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGCG ACCAGATCCG GGTCACCCGC GCCCTCCTTT CCGTTTCGGA CAAGACCGGG 
CTCACGGACT TCGCTGCGGC CCTGAGCCAG CGCGGCGTCG AACTGGTCTC GACGGGCGGC 
ACCCACCGCG CGTTGACCGA AGCGGGTCTC GCCGTCCGGG AAGTCTCCGA GCTGACGCGC 
TTCCCCGAGA TGATGGACGG CCGGGTGAAG ACCTTGCATC CGGCGGTCCA TGGCGGCCTG 
CTCGCGGTGC GCGACAACCC CGAGCATCAG GCGGCTTTGG CCGCCCACGG CATCGGCGCG 
ATCGACCTGC TCGTGGTCAA CCTCTACCCG TTCGAGGAAA CGCTGAAGGC CGGCAAGGCC 
TATGACGATT GCGTCGAGAA CATCGATGTC GGCGGCCCGG CGATGATCCG CGCGGCGGCC 
AAGAACCATG CCGACGTCGC CGTGGTGGTG GATGTTTCGG ACTACGGCGT CATCCTCGCC 
GAACTCGCGG AGCATGACGG CAACCTCACC GCCACGACCC GCCGCAGGCT GGCGCAGAAG 
GCGTTCTCGC GCACCGCCTC CTACGACGCG GCAATCGCCA ACTGGCTCGC CGAAGTCGAG 
GGACGCGACA AGGCCCCGAA CTTCAAGGCG CTCGGCGGAA CGCTCGCCCA GAGCCTGCGC 
TACGGCGAGA ACCCGCACCA ATCGGCTGCC TTCTACCGCC TGCCCGGCAC CCTGCGCCCC 
GGCATCGCCA CCGCCCGGCA GGTCCAGGGC AAGGAACTGT CCTACAACAA CCTCAACGAC 
ACCGACGCCG CCTACGAATG CGTCGCCGAG TTCGACCCCG CCCGCACGGC GGCGGTCGCG 
ATCATCAAGC ACGCCAATCC CTGCGGCGTG GCCGAAGGGC CGGATCTGCT GGCGGCCTAC 
GAGCAGGCGC TGGCCTGCGA TCCGACCTCG GCCTTCGGTG GCATCGTCGC CCTCAACCGG 
CCTCTCGACG CCGAGGCCGC GAGAAAGATC GTCGAGATCT TCACCGAGGT CATCATCGCC 
CCCGACGCCT CCGAGGAAGC GCTCGCTATC GTCGGCGCCA AGAAGAACCT GCGGCTTCTG 
CTCGCCGGCG GCCTCGCCGA TCCGCGGGCG AAGGGTGAGG TCATCCGCAC GGTGGCGGGC 
GGCTTCCTGG TCCAGGGCCG GGATGCGCTC AGCGTGGACG ACATGGACCT GAAGGTCGTG 
ACCAAGCGCG CCCCGAGCGA GGCGGAACTC GCCGACATGC GCTTTGCCTA TCGGGTGGCC 
AAGCACGTGA AGTCGAACGC CATCGTCTAC GCCAAGGGCG GCGCCACGGT CGGCATCGGC 
GCCGGCCAGA TGTCGCGGGT GGATTCCTCG ATCACCGCCG CGCGCAAGGC GGCGGAAGCG 
GCGCAGCGCC TCGGCCTGTC CGAGAGCCTC GCCAAGGGTT CGGCGGTGGC CTCCGACGCC 
TTCTTCCCCT TCGCCGACGG CCTGCTCGCC GCCGCCGAGG CCGGTGCCAC CGCCGTGATC 
CAGCCCGGCG GCTCGATGCG CGACGATGAG GTGATCCGGG CCGCCGACGA GGCCGGGCTC 
GCCATGGTGT TCACCGGCGT GCGCCACTTC CGGCACTAG

Protein sequence

MPRDQIRVTR ALLSVSDKTG LTDFAAALSQ RGVELVSTGG THRALTEAGL AVREVSELTR 
FPEMMDGRVK TLHPAVHGGL LAVRDNPEHQ AALAAHGIGA IDLLVVNLYP FEETLKAGKA 
YDDCVENIDV GGPAMIRAAA KNHADVAVVV DVSDYGVILA ELAEHDGNLT ATTRRRLAQK 
AFSRTASYDA AIANWLAEVE GRDKAPNFKA LGGTLAQSLR YGENPHQSAA FYRLPGTLRP 
GIATARQVQG KELSYNNLND TDAAYECVAE FDPARTAAVA IIKHANPCGV AEGPDLLAAY 
EQALACDPTS AFGGIVALNR PLDAEAARKI VEIFTEVIIA PDASEEALAI VGAKKNLRLL 
LAGGLADPRA KGEVIRTVAG GFLVQGRDAL SVDDMDLKVV TKRAPSEAEL ADMRFAYRVA 
KHVKSNAIVY AKGGATVGIG AGQMSRVDSS ITAARKAAEA AQRLGLSESL AKGSAVASDA 
FFPFADGLLA AAEAGATAVI QPGGSMRDDE VIRAADEAGL AMVFTGVRHF RH