Gene Mext_3691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3691
Symbol
ID	5831536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4086075
End bp	4087133
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	69%
IMG OID	641369483
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001641138
Protein GI	163853095
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.139305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTC TGGTAACGGG CGGCTGCGGC TTCATCGGCT CCGCGCTCGT GCTGCATCTG 
GTGCAGGATC TCGGCCACGA GGTGCTGACC CTCGATGCCA TGACCTACGC CGCCAACCCG 
ATCTCGCTGC AGCCGCTGGC GGACGACCCG CGCCACCGCC TGGAACAGGC CGACATCTGC 
GATCCGGCCC GCGTCCACGC CCTCTACGCC GAGTTCAAGC CCGAGGCGGT GATGCATCTG 
GCCGCCGAGA GCCATGTCGA TCGCTCGATC ACCGATCCGG GTGCCTTCGT GCGCACCAAC 
GTCATCGGCA CCCAGGTCAT GCTCGACGGC GCCCGCACCC ATTGGGAAAG CCTCGACCGC 
GAGGCCAAGG CGACGTTCCG CTTCCTCCAC GTCTCGACCG ACGAGGTCTA CGGCTCGCTG 
CCGCCGGACG CATTCTTCAC CGAGGAGAGC CGCTACGACC CGCGCTCGCC CTACTCGGCG 
TCAAAAGCGG CCTCCGACCA TCTCGCCCGC GCCTGGCACG AGACCTACGG CCTGCCGGTT 
CTGGTGACGA ACTGCTCGAA CAATTACGGC CCGCGCCACT TCCCCGAAAA GCTGATCCCG 
CTGATGATCC TGGCGGCGCT GGAGGGCAAG CCGCTCCCGG TCTACGGCGA CGGTCTGAAC 
GAGCGCGACT GGATCCATGT CGAGGACCAT GCCCGCGGCC TCGTCGCGGT GCTGGAGCGC 
GGCCGGCTCG GCGAGACCTA CCTGCTGGGC GGGCGCTCGG TGCGGAACAA CCTCGCTGTG 
GTGAAGGCGC TTTGCGCCGC CTTCGACCAG CTCAAGCCCG AGAACGGCCC GCACGAGCGC 
CTGATCAGCT TCGTCGCCGA CCGGCCCGGC CATGACCGCC GCTACGCGAT CGACCCGTCG 
AAGGCGGAAG CCGAGGTCGG CTGGCGGCCG ACCAAGGTGT TCGAGGAAGC GCTGACGGAG 
ACCGTGCGCT GGTATCTTGA CAACGAGGCG TGGTGGCGCC CGATCCGCGA GGGCCGCTAT 
TCCGGCGAGC GCCTCGGTCT CGCACCCAAG AGCGCCTGA

Protein sequence

MRILVTGGCG FIGSALVLHL VQDLGHEVLT LDAMTYAANP ISLQPLADDP RHRLEQADIC 
DPARVHALYA EFKPEAVMHL AAESHVDRSI TDPGAFVRTN VIGTQVMLDG ARTHWESLDR 
EAKATFRFLH VSTDEVYGSL PPDAFFTEES RYDPRSPYSA SKAASDHLAR AWHETYGLPV 
LVTNCSNNYG PRHFPEKLIP LMILAALEGK PLPVYGDGLN ERDWIHVEDH ARGLVAVLER 
GRLGETYLLG GRSVRNNLAV VKALCAAFDQ LKPENGPHER LISFVADRPG HDRRYAIDPS 
KAEAEVGWRP TKVFEEALTE TVRWYLDNEA WWRPIREGRY SGERLGLAPK SA