Gene Mchl_3035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_3035
Symbol
ID	7118313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	3202424
End bp	3203572
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	60%
IMG OID	643525786
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_002421801
Protein GI	218530985
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.416925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCCTT GCGCAAATTA CTACCGTCCC GAGATCCTTG CCGACGAACT GGACACTCTG 
TTCGATCCAC TCTGGCAATT TGGAGCCCTA GCAGGAGAAC TCGCCGCGGA TCGCGATTTC 
GTCTGCGTCG ATTACAAGAA CACGGCGACC GTCCTGCAGA ACTTCCGCGG CGAGATCCGG 
GCATTCGCCA ATGTGTGCAG CCATCGGTTC AACCGCATCC AGCCGGGCGA GCGCGGCAAC 
CGGCCGCTGA TGTGTGCCTA TCATGGCTGG AGCTTCGACA GCACCGGTTT CCCGCACGGC 
ATGCCGCGCC GCGGCGGATT CGCGCTCGAT GATCGCGAGC GGTTATGTCT GACCGGTTAC 
GAAGTTGAGA CGTGCGGAAT TTTCGTATTT TTTCGTAAGC GGAGCGGCGG ACCGTCTCTG 
CGCGAGTATC TGGGCGCATT CTATCCACTG CTTGAGCAGA TCGGATCCTA TTTCGGACCG 
GAAATTGATG CTGGAACAAT TTCACACGCG GCCAATTGGA AGCTGCTCGT CGAGAACGTT 
CTTGAATGCT ACCATTGCTC GGTCGTCCAT CAGGACACGT TCGTGAAAAC GCTCGGGATT 
GGCAGAGCAG GCATCGAGCA GGAACGGTTC GACGGACCGC ATTCCAGTAG CCACTTCCCG 
CGCACCGCGA CGGCCGGAGA GGCCCGGCGG CAGAAGGCGC TCGCCTATCT CGACACCCGC 
GCCTTCACCC ACGACTCGTT TTTCCACATT CACATCTTTC CCAACCTGTT CATCTCATCG 
ACGCAGGGCC TGTCTTTTTA TGTCGGCCAC GCTTTGCCTC TGTCGGCGAC GGAAACCGGA 
CTGCGCTTTC GGCTATTCGA ACCGAAGCTC GACCTGACCC GTGCGCAGCG CGCGGCACAG 
GATCTGATCA ACCAATCGGG CAAGGCGCTG GGTCGTGCGG TGATCGACGA GGACCGAGCG 
ATCCTGGAAA ATGTCCAGCG GGGCGTCGAA TTGTCGGAGA AGCCCGGTGT GATCGGTCGC 
GACGAAATCC GGATCGCCGC GTTCATGCGC GCCTACACGC ACCTCATGGG TGGCGGCTCA 
CTTGGCGGTA TACCCTCCAT CGACGACCAT GTTGCTGCCG GTGATCCAGC GCGAAGCATC 
GCTGAGTAG

Protein sequence

MLPCANYYRP EILADELDTL FDPLWQFGAL AGELAADRDF VCVDYKNTAT VLQNFRGEIR 
AFANVCSHRF NRIQPGERGN RPLMCAYHGW SFDSTGFPHG MPRRGGFALD DRERLCLTGY 
EVETCGIFVF FRKRSGGPSL REYLGAFYPL LEQIGSYFGP EIDAGTISHA ANWKLLVENV 
LECYHCSVVH QDTFVKTLGI GRAGIEQERF DGPHSSSHFP RTATAGEARR QKALAYLDTR 
AFTHDSFFHI HIFPNLFISS TQGLSFYVGH ALPLSATETG LRFRLFEPKL DLTRAQRAAQ 
DLINQSGKAL GRAVIDEDRA ILENVQRGVE LSEKPGVIGR DEIRIAAFMR AYTHLMGGGS 
LGGIPSIDDH VAAGDPARSI AE