Gene M446_4030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4030
Symbol
ID	6132881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4495488
End bp	4496708
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	69%
IMG OID	641644187
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001770827
Protein GI	170742172
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR02622] CDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA TGTCTTTCTG GTCCGGCAAG CGCGTCCTCG TCACCGGTTC GGCCGGGTTC 
CTCGGCTCGT GGACGGTGCG GACCTTGCGC GAGAGCGGCG CATTGGTGGT CGGCTACGTG 
CGCGACCTCA ATGCCTACGG AAATTCGCTG GCGGATGACT TGGCCAAGCC GACCATCGTC 
GTGCACGGCC GGCTGGAGGA TCGGGAGACC CTGCGGCGTG CCGTGAACGA GCACGAGGTG 
GACACGGTGA TCCACCTCGC CGCTCAGCCG ATCGTCGGCA CGGCCCTGCG CGATCCGGTG 
GGCACCTTCG AGGCCAACAT TCGGGGTACC TGGAACCTGC TCGACGCCTG CCGGCTGTAC 
GGGAAGGTCG AACGCATCCT CGTCGCGTCC AGTGACAAGA GCTACGGCAG TTCCGACGTC 
CTTCCCTATA CGGAAGACAT GCCGCTTGTC GGGCGCGCAC CCTACGACGT CTCCAAGAGC 
TGCACCGACC TCCTGGCGCG CAGCTACTTC GAGACCTACG GCCTGCCGAT CTGCATCACG 
CGGGCCGGCA ACTTCTTCGG CGGAGGCGAC CTCAACTTCA ACCGGCTGGT GCCCGGGACG 
ATCCGCTGGG CGCTGCGGGG CGAGCGCCCC GTGCTGCGCT CGGACGGCAC GATGATCCGC 
GACTACATCT ACGTCCGGGA CGTCGTGGCC GGATACCTCG CCATCGGCGA GGCCATGCAC 
GAGCCGGGCG TGGCCGGCGA GGCCTTCAAC CTGTCGAACG AGACGCCCCT CAGCACGATG 
GCCTTCACCC ACGAGATCCT CCGCGCCTGC CGGCGCCCGG ATCTCGAACC GCTGGTCCTG 
GGCGAGGCCC GGTCGGAGAT CGACGCCCAG CACCTCAGCG CCGCGAAGGT CCGGCGGATC 
GTCGGCTGGT CGCCGCGGTG GAGCATGGCG GACGCCCTGG CGGAAACCGT CGCCTGGTAC 
CGGAACTACA TGGGCCGGAT CGGTGAGATC GAACGGGAAG CCCCTCCGCA CGATGGCCTT 
CGCCAACGCG ATCCTCAGCG CCTGCCGGCG CCCGGATCTC GCACCGCTGG TCCTGGGCGA 
GGCCCGGTCG GAGATCGACG CCCGGCACCT CAGCGCCGCG AAAGTCCGGC GGACCGTCGG 
CTGGTCGCCG CGGTGGAGCA CGGCGGACGC CCTGGCGGAA ACCGTCGCCT AGCCCCGGAA 
CTCCATCGGC CGGATCGGTG A

Protein sequence

MSKMSFWSGK RVLVTGSAGF LGSWTVRTLR ESGALVVGYV RDLNAYGNSL ADDLAKPTIV 
VHGRLEDRET LRRAVNEHEV DTVIHLAAQP IVGTALRDPV GTFEANIRGT WNLLDACRLY 
GKVERILVAS SDKSYGSSDV LPYTEDMPLV GRAPYDVSKS CTDLLARSYF ETYGLPICIT 
RAGNFFGGGD LNFNRLVPGT IRWALRGERP VLRSDGTMIR DYIYVRDVVA GYLAIGEAMH 
EPGVAGEAFN LSNETPLSTM AFTHEILRAC RRPDLEPLVL GEARSEIDAQ HLSAAKVRRI 
VGWSPRWSMA DALAETVAWY RNYMGRIGEI EREAPPHDGL RQRDPQRLPA PGSRTAGPGR 
GPVGDRRPAP QRRESPADRR LVAAVEHGGR PGGNRRLAPE LHRPDR