Gene Mext_4000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4000
Symbol
ID	5832784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4439459
End bp	4440697
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	69%
IMG OID	641369792
Product	cytochrome P450
Protein accession	YP_001641442
Protein GI	163853399
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.854274
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.53904
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGAA GCACACTGTT CGATCAGATC CTCGATCCCG CCAACCGGGC GAACCCCTAC 
CCGCTCTACG CCGAGCTGCG AAAATTCCCG GTCGCGCGGC AGGAGGACGG CACCTACGTC 
GTCAGCGGCC ATGCCGAGCT GGCGCGGCTG ATCTCCGATC CGCGGATCAG CTCGGACGAT 
CTGCCCGATC CGCAGAAATT CCGCTGGACC GGGCAACCCG TCACCGACCT GCTGGTGCGG 
CCGGTGCGGG CCGAGATCCG CAAGCGGCAC CGCCCCTTCA TCTTCCGCGA CCCGCCCGAC 
CACGACCGCC TGCGGGGGCA GGTGATGCGC TGCTTCACGC CCGAGCGGGT GCGCGGCATG 
CGCGCGAAGA CGCAAGAAAT CACCGACGAC CTGATCGGCA AGATGCGCGG CAAGACCCAG 
ATCGATCTCG TCGACGACTT CTCCTATCCG CTCCCCGTCA CCGTGATCTG CGAGCTGCTC 
GGCGTGCCGC CGGAGGACGA GGCGCAGTTC CACGGCTGGG CGACGCAGCT CGCGACCGCG 
CTGGAGCCGA ACCAGCGCGG CGACGCGGAG ACCAAGGCCA AGAACGAGGT CTGCTTCAAC 
GAGATCGCCG ACTACCTCCA GGGGCTGATC AAGGAGAAGC GCAAGGACCC GCAGCAGGAC 
ATCCTCTCCG ACCTCGCGAC CGATAAGGAG GGGATGAACG ATTTCGACCT GATCGCCACC 
GCCGTGCTGC TGCTGGTGGC GGGCCACGAG ACCACGGTGA ACCTGATCAC CAACGGGATG 
CTGACGCTGC TGCGCTTCCC CGAGCATGGG GAGCGTCTGC GCGCCGAGCC GGACCTCGCC 
CCGCGCCTGA TCGAGGAATT GCTGCGCTAC GAGCCGCCGG TCCATTACCG CACGCGCGTA 
GCGCTCACCG ACATCCCGGT GGCCGGGATC ACCATCCCGA AGGATGCGCC GGTGATTTTC 
CTGCTCGCCG CCGCTAACCG CGACCCGGCG CGCTTTCCCG ACCCCGACCG CTTCGATCCC 
GACCGGCCCG ACAACCGCCA TCTCGGCTTC GGCGGCGGGC TGCATTACTG CGTCGGTGCC 
CCGCTCGCGC GGATCGAGGC GGAAGTGGCC CTGATCAGCC TCGTGCGGCG GCTGAAGGGC 
GTCTCCCTGA TCGAGGACCC ACCACCCTAC CGGCCCGGCG CCTCGCTGCG CGGACCGCGG 
CACCTGAGGC TGGCGCTGGA GGGTGTGGCG GAGGAGTAA

Protein sequence

MSGSTLFDQI LDPANRANPY PLYAELRKFP VARQEDGTYV VSGHAELARL ISDPRISSDD 
LPDPQKFRWT GQPVTDLLVR PVRAEIRKRH RPFIFRDPPD HDRLRGQVMR CFTPERVRGM 
RAKTQEITDD LIGKMRGKTQ IDLVDDFSYP LPVTVICELL GVPPEDEAQF HGWATQLATA 
LEPNQRGDAE TKAKNEVCFN EIADYLQGLI KEKRKDPQQD ILSDLATDKE GMNDFDLIAT 
AVLLLVAGHE TTVNLITNGM LTLLRFPEHG ERLRAEPDLA PRLIEELLRY EPPVHYRTRV 
ALTDIPVAGI TIPKDAPVIF LLAAANRDPA RFPDPDRFDP DRPDNRHLGF GGGLHYCVGA 
PLARIEAEVA LISLVRRLKG VSLIEDPPPY RPGASLRGPR HLRLALEGVA EE