Gene Mchl_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2037
Symbol
ID	7118737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	2134603
End bp	2135676
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	643524787
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_002420812
Protein GI	218529996
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.950553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.781731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACGA CCCGCCAGAA GCTGTGGCGC CATTACTGGT ACGCGACCTT GCGCCTGTCC 
GACCTCGCCG ACGGCCCCAA GCCCTTCACC CTGATGGGCG AGCGGATCGT GCTGTTTCTC 
GACGGCGAGG GCGAGCCCGC CGCGATGATG GACCGCTGCT GCCACCGCAC CGCCCGGCTC 
TCCAAGGGCT GGTGCGAGGA CGGCCTGATC GTGTGCGGCT ATCACGGCTG GGCCTATGAC 
CGGCACGGCG CGCTCGCCCG CATCCCGCAA TTCAGCCCGG AGCAGGTCGT GCCGCGGCTC 
GCGGTGAAGA GCTACCACTG CACCGCGAAG TACGGCTACG CCTGGGTCTG CCTGGAGGAG 
CCCTACGCGG CGATCCCCGA GATCCCCGAG GACACGATGC CCGGCTACCG GCGCATCCAG 
CAATTCCACG ACGTGTGGAA GACCTCGCCC CTGCGCCTGA TGGAGAACTC GTTCGACAAC 
GCGCACTTCG CCTTCGTGCA CCAGAACACG TTCGGGCAGA TCAGCCAGCC GATCCCGGAA 
AAGTACGAGA TCACCGAGAC TGAGTACGGC TTCGAGGCGG AGACGATCAT CACCATCGCC 
AACCCGCCGA TGGCCCACCG CATCAGCGGC ACCACTGAGC CGACCACCAA GCGCCACATG 
CGCAACAAGT GGTTCATGCC GTTCTGCCGC CGGCTCGACA TCGAATACCC GTCGGGCTTG 
CGGCACATCA TCTTCAACTC GGCGACGCCG ATCGACGACG GCACGATCCG ACTCGCGCAG 
ATCCTCTACC GCAACGACCG CGAGGAGGAT TGCTCAACGG AAGCGCTGAT CGCCTGGGAT 
GCGGTGATCG TCGAGGAGGA CCGCGACATC CTCGAATCGA CCGACCCGGA CGCCGCGGTC 
GATATGGGCC GCAAGGTCGA GAGCCACATG CCCTCCGACC GCCCCGGCAT GATCATGCGC 
CGCCGCCTGC TGGCCGCCCT GCACGCCCAT GGTGAGGAGG AGGTGTCAGA GGCAACGCCG 
GCGGTCTCCG TGCCGGTGGC GCCGACGCTG ATGCCGCACG AGAGGGTCGC GTGA

Protein sequence

MLTTRQKLWR HYWYATLRLS DLADGPKPFT LMGERIVLFL DGEGEPAAMM DRCCHRTARL 
SKGWCEDGLI VCGYHGWAYD RHGALARIPQ FSPEQVVPRL AVKSYHCTAK YGYAWVCLEE 
PYAAIPEIPE DTMPGYRRIQ QFHDVWKTSP LRLMENSFDN AHFAFVHQNT FGQISQPIPE 
KYEITETEYG FEAETIITIA NPPMAHRISG TTEPTTKRHM RNKWFMPFCR RLDIEYPSGL 
RHIIFNSATP IDDGTIRLAQ ILYRNDREED CSTEALIAWD AVIVEEDRDI LESTDPDAAV 
DMGRKVESHM PSDRPGMIMR RRLLAALHAH GEEEVSEATP AVSVPVAPTL MPHERVA