Gene Mext_3670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3670
Symbol
ID	5833078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4059734
End bp	4060765
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	73%
IMG OID	641369463
Product	luciferase family protein
Protein accession	YP_001641119
Protein GI	163853076
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCCT CTCTGCCTCC CCTCTCCGTC CTCGATCTCG CCTTCATCCC GGAGGGCGCC 
ACGCCGCGGC AGGCGCTCGC CAACAGCGTC AGCCTCGCCC GGCACGCGGA GGAGCTCGGC 
TACCGCCGCT TCTGGCTCGC CGAGCACCAC AACATGGTCG GCATCGCCAG CGCCGCCACG 
GCGGTGGTGA TCGGCCATGT GGCGGCGGGA ACGGATCGCA TCCGGGTCGG CGCCGGCGGG 
ATCATGCTGC CCAACCACGC GCCGCTGGTG ATCGCCGAGC AGTTCGGCAC GCTGGAATCG 
CTGTATCCGG GCCGGATCGA TCTCGGGCTC GGCCGGGCGC CGGGCACGGA CGGGCTGACG 
CTGCGCGCGC TGCGCCGCGA CTACGAGTCG GCGGAGCGCT TTCCCCAGGA CGTGCTCGAA 
TTGCAGGCCC TGTTCGGCCC GGTGCGGGAG GGGCAGTCGG TGCAGGCGGT GCCCGGAACG 
GGGCTGAAGG TGCCGCTGTG GATCCTCGGC TCCAGCCTGT TCGGGGCGGA ACTCGCCGGC 
ATGCTCGGCC TGCCCTATGC CTTCGCCTCG CATTTCGCGC CCGATGCGCT GCTGCCGGCG 
CTCGCGGCCT ACCGCGCCCG CTTCCAGCCG TCCGAGCAGT TGCAGCGGCC CTACGCCATG 
GTCGGCGTCA ACGTTGTCGC GGCGGAGACC GATGCGGAGG CGCAGCGCCT GTTCACCACG 
GTGCAGCAGC AATTCACCCG GCTGGTGCGC GGCACCCGCG GCCTGCTGCC CCCGCCGATC 
GACGACATCG AGGCCTATTG GCGCCCGGCG GAGAAGGCGC AGGCCTCGCG GATGCTGGCG 
CGTGCGCTGG TGGGCTCGCG CAAGACCGTT CGCGCCGGGC TGGAGGCGCT GGTGGCCGAG 
ACCGGCGCCG ACGAGGTGAT GGTGGCCTCG GCCCTCTACG ACCACGAGGC GCGGCTCGCC 
TCCTACGCGA TCCTCGCCGA GGCGCATGGC GCTCTGGCGG CGCAGGCCCT GCCCGCGCGC 
TCAGCGGCCT GA

Protein sequence

MSSSLPPLSV LDLAFIPEGA TPRQALANSV SLARHAEELG YRRFWLAEHH NMVGIASAAT 
AVVIGHVAAG TDRIRVGAGG IMLPNHAPLV IAEQFGTLES LYPGRIDLGL GRAPGTDGLT 
LRALRRDYES AERFPQDVLE LQALFGPVRE GQSVQAVPGT GLKVPLWILG SSLFGAELAG 
MLGLPYAFAS HFAPDALLPA LAAYRARFQP SEQLQRPYAM VGVNVVAAET DAEAQRLFTT 
VQQQFTRLVR GTRGLLPPPI DDIEAYWRPA EKAQASRMLA RALVGSRKTV RAGLEALVAE 
TGADEVMVAS ALYDHEARLA SYAILAEAHG ALAAQALPAR SAA