Gene Mchl_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2035
Symbol
ID	7118735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	2132651
End bp	2133622
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	71%
IMG OID	643524785
Product	2OG-Fe(II) oxygenase
Protein accession	YP_002420810
Protein GI	218529994
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.415947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.577348
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCAGG CGGATCTCCC GATCGTCGAT ATCGCCCCGT TCATCCACGG CGACTCCACC 
GCGCGGGCGG GGGTCGGGCG CGCCTTCGGG CATGCCTTCG AGACGACGGG TTTCGCCGTC 
GTCGTCGGCC ATGGCATCCC CGAGCGTCTG GCGAACGACG TCTACGACGC GATGAAGCGC 
TACTTCGCGC AGCCGCTCGC GGTGAAGAGC TGCGACGCCG CGCCGGAGAA GACCAAGGGC 
CGGGGCTACC TGCCGATCGG CATCGAGAGC GTGGCCCGGA CGCTTCAGGG CGAGACGCCG 
CCCGACCTGT GCGAGGCGCT GGTCTTCAAC GCGCCCCATC GCGAGGGGCC CTCGGCGCGC 
CCCAACATCT GGCCCGCCGA GCCGCCGGAA CTGCGCGGCC TCGTCGAGGC GTGGCGCGAC 
GCGATCCTGC GGCTGACCGG GCAGCTCACC GAATTGTCGG CGCTCGCACT CAACCTGCCG 
CAAGACTACT TCGCGCCCTG GTTCGCCGAT CCGGCGCTGA CGCTGCGCTT CGTCCACTAT 
CCCGATCAGG CCGAGCCGCC GATACCGGGC CAGCTCCGCT ACGGCGCCCA CCACGATTAC 
GGCGGCCTGA CGATCCTGCG GCAGGACACG GCGCCCGGCG GCCTCCAGCT CGCCGACCGC 
GACGGCAACT GGTTCGAGGC CGGCGTGGTG CCGGATTCCT TCGTCATCAA TGTCGGCGAC 
CTCCTAGCCC GCTGGACCAA TGAGCGCTGG CGCTCGACCC TGCACCGGGT GTCGAACCCC 
GACCGCGCGC TGACCGGCTC GTCCGCCCGT CTGTCGATGG TCGCCTTCAC CGCGCCGAAC 
GAGCTGTCCG AGGTCGCCTG CCTGCCGAGC TGCTGTGATG CGGCCAACCC GCCGCGCTAC 
GAGCCGGTGA AGGCCGGCGC CTACATCCTG TCGAAGCTCC AGGCTTCGAT GGACCTGACG 
GCCCGGGCCT GA

Protein sequence

MRQADLPIVD IAPFIHGDST ARAGVGRAFG HAFETTGFAV VVGHGIPERL ANDVYDAMKR 
YFAQPLAVKS CDAAPEKTKG RGYLPIGIES VARTLQGETP PDLCEALVFN APHREGPSAR 
PNIWPAEPPE LRGLVEAWRD AILRLTGQLT ELSALALNLP QDYFAPWFAD PALTLRFVHY 
PDQAEPPIPG QLRYGAHHDY GGLTILRQDT APGGLQLADR DGNWFEAGVV PDSFVINVGD 
LLARWTNERW RSTLHRVSNP DRALTGSSAR LSMVAFTAPN ELSEVACLPS CCDAANPPRY 
EPVKAGAYIL SKLQASMDLT ARA