Gene Mext_1738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1738
Symbol
ID	5835586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1960079
End bp	1961197
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	66%
IMG OID	641367537
Product	luciferase family protein
Protein accession	YP_001639208
Protein GI	163851165
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03612] pyrimidine utilization protein A

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGG CCAAAGATCA CGCCATGAAT ATCGGCGTCT TCATCCCGAT CGGAAACAAC 
GGCTGGCTCC TGTCGGAGAA TGCGCCGCAG TACATGCCGA GCTTCGATCT CAACAAGCAG 
ATCACGCTCA AGGCGGAACA GCACGGCCTC GACTTCGTGC TCTCAATGAT CAAGCTGCGC 
GGCTTCGGCG GCAAGACCGA GTTCTGGGAT CACAACCTCG AATCGTTCAC GCTGATGGCC 
GGGCTTGCCG CGGTCACGAG CCGGATCAAG CTCTACGCCA CGGCCCCGAC CCTGTGCCTG 
CCGCCGGCGA TCGTCGCGCG CATGGCCTCC ACCATCGACT CGATCTCGAA TGGCCGCTTC 
GGCCTCAATC TCGTCACCGG CTGGCAGCGG CCGGAATACG CGCAGATGGG CCTGTGGCCG 
GGCGACGAGT ATTTCGGCCG CCGCTACGAG TATCTCTCCG AATACGCGCA GGTTCTGCGC 
GAGCTGTGGG AGACCGGCCG CAGCGATCTC AAGGGCGAAT TCTTCCAGAT GGAGGATTGC 
CGCCTGAGCC CGCGCCCGCA GGCGGAGATG AAGATCATCT GCGCCGGGCA GAGCGCCGCC 
GGCATGGCCT TCACCGCGAC CTATGCCGAC TACAATTTCT GCTTCGGCAA GGGGGTCAAC 
ACGCCGACCG CCTTCGCCCC CACCGTGGAA CGGCTGGAGG AGGCCAAGGC GAAGACCGGC 
CGCGATGTGT CCTCCTACGT CCTGTTCATG GTCATCAGCG ACGAGACCGA CGAGGCGGCC 
CGCGCCAAGT GGGAGCACTA CAAGGCCGGC GCCGACGCGG AGGCGATCGC CTGGCTCGGC 
CTCCAGGGCG CGGCCGACAC CAAGTCCGGC GCCGACACCA ACATCCGCCA GATGGCCGAC 
CCGACCTCGG CGGTGAACAT CAACATGGGC ACCCTGGTCG GCTCCCACGC CACCGTCGCC 
GCCCTGCTCG ACGAAGTCGT GACCGTACCG GGCACCGGCG GCGTGCTGCT GGTCTTCGAC 
GACTTCCTGA AGGGCCTCGA CGATTTCGGC ACGAAGATCC AGCCGCTGAT GCGCTCGCGC 
CGGCACGTCA CCGGCGAAGC ACTGGCGGAG GTGGCGTGA

Protein sequence

MTQAKDHAMN IGVFIPIGNN GWLLSENAPQ YMPSFDLNKQ ITLKAEQHGL DFVLSMIKLR 
GFGGKTEFWD HNLESFTLMA GLAAVTSRIK LYATAPTLCL PPAIVARMAS TIDSISNGRF 
GLNLVTGWQR PEYAQMGLWP GDEYFGRRYE YLSEYAQVLR ELWETGRSDL KGEFFQMEDC 
RLSPRPQAEM KIICAGQSAA GMAFTATYAD YNFCFGKGVN TPTAFAPTVE RLEEAKAKTG 
RDVSSYVLFM VISDETDEAA RAKWEHYKAG ADAEAIAWLG LQGAADTKSG ADTNIRQMAD 
PTSAVNINMG TLVGSHATVA ALLDEVVTVP GTGGVLLVFD DFLKGLDDFG TKIQPLMRSR 
RHVTGEALAE VA