Gene Mext_0850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0850
Symbol
ID	5831710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	926573
End bp	927613
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	71%
IMG OID	641366632
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001638326
Protein GI	163850283
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.552823
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.388725
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGGG TTCTCGTGAC CGGCGGGGCC GGCTTCGTCG GCCGCCACGC GGTCGCCGCT 
TTGGCCGCTC GCGGCTTCGA GGTTCACGCC ATCGGCCGAA CCGCGCCGGA GGGTGCCCAT 
GCCTTTCACG CGGCCGACCT GCTCGATCCG GTGCAACGCC GGGCCGTCGT GCAGGCGGCC 
TCGGCGAGCC ACCTGCTCCA CCTCGCCTGG ATCACCACAC CCGGCCGCTA CTGGCAGGCA 
CCGGACAACC TCGACTGGAC GGCTGCGAGC CTCGACCTCG TGCGGACGTT CCGCGAGGCG 
GGGGGCACCC GCGCCGTGGT GGCCGGGACC TGTGCCGAGT ACGATTGGAC GGGGATCAAC 
CTTCTGCCAC GTGCAGAATT GGAATCCCCC TCTCCCCGCA CGCGGGGAAA GGGCTTCGGC 
GAGCCTGTCG TCGCGACCCT ATCCCCGCAA GCGGGGCGCG GGGATGCAGC GGCGATCCAA 
GAGGGTCATT TGGCGGAAGC GGCCCCCTGC CGCCCGGCGA CGCTCTATGG CGCCGCCAAG 
GACGGTCTTC GCCTCATTCT GCAAGCCTAT GCGGCGACCG CCGGCCTCTC CCTCGGCTGG 
GGGCGATTGT TCTACCTCTA CGGTCCCGGC GAGACGCCGG GCCGACTCGT CGGCGATGCG 
GCGCGGGCGC TGCTCACGGG CCAGCGTCTC GCCACCAGCG AGGGCCGGCA GCGGCGCGAT 
TTCCTGCATG CCGCCGATGT GGGAGCGGCC TTCGCGGCCC TGCTCGACTC GGGGGTGGAG 
GGGCCCGTCA ATATCGGCTC GGGCGAAGCG GTGCCGGTGC GCAGAATCCT GGAAACGATC 
GGTGCGCTGA CCGGACGCCC CGATCTGATC GATTTCGGCG CCCGCCCCCT CGGCCCGGCG 
GAGCCGGCCC GCATCGAGGC CGACATCCGG CGCCTGACGG ACGAGGTTGG CTTTTCGGCC 
CGCTACGGCC TCGAACAGGG CCTAGAGCAA ACCGTCGCGG CTTGGCGCGC CGCGCTCAGC 
AATGCGGCAT CAATCCCTTG A

Protein sequence

MKRVLVTGGA GFVGRHAVAA LAARGFEVHA IGRTAPEGAH AFHAADLLDP VQRRAVVQAA 
SASHLLHLAW ITTPGRYWQA PDNLDWTAAS LDLVRTFREA GGTRAVVAGT CAEYDWTGIN 
LLPRAELESP SPRTRGKGFG EPVVATLSPQ AGRGDAAAIQ EGHLAEAAPC RPATLYGAAK 
DGLRLILQAY AATAGLSLGW GRLFYLYGPG ETPGRLVGDA ARALLTGQRL ATSEGRQRRD 
FLHAADVGAA FAALLDSGVE GPVNIGSGEA VPVRRILETI GALTGRPDLI DFGARPLGPA 
EPARIEADIR RLTDEVGFSA RYGLEQGLEQ TVAAWRAALS NAASIP