Gene M446_4893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4893
Symbol	mdoD
ID	6132290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5372914
End bp	5374470
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	74%
IMG OID	641645029
Product	glucan biosynthesis protein D
Protein accession	YP_001771656
Protein GI	170743001
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3131] Periplasmic glucans biosynthesis protein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00109342
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCTCGACC GCCGCCGCTT CCTCGCCGCC GCCGCGCTCC TGGCCGGCGG CCTCCCCGCC 
CGCGCGGCCG GCCTGCCGCT CGGGGCGCCG AGCCCCTTCG ACTTCGAGGC GCTGAAGGCC 
CGCGCCCGCG ACCTCGCCGC CGCGCCCTAC CGGCCCCCGG CGATCCCCGA CCGGGAGGTG 
CTGCAGGCGA TCGACTACGA CGCCCACGGC AAGCTGCGCT TCAAGCCCGA CCACGCCCTC 
TGGGCCGAGG GCCCGGGCGC CTTCCCGGTG ACCTTCTTCC ATCTCGGCCG CTACTTCCAG 
AAGCCGGTGC GGATGCACCT GGTCGAGGGG GGCGAGGCCC GCGAGATCGT CTACGTCCAG 
GACGCCTTCG AGATGCCGGC GGATTCGCCC GCCCGGCGCC TGCCGCCGAA TCCCGGCTTC 
GCGGGTTTCC GCTTCCAGGA GCGGCGCGGC GGCGCCCTCG ACTGGCGGCG CAACGACTGG 
GTGGCGTTCC TCGGCGCCTC CTATTTCCGG GCGATCGGCG AACTCTACCA GTACGGACTC 
TCGGCGCGGG GCCTCGCCCT CGACACCGTG ATGCCGGACC GGCCGGAGGA GTTTCCCGAC 
TTCACTCATG TCTGGTTCGA GACGCCGGCG CCGGATTCCG ACACCGTCAC GGTGATGACG 
CTCCTCGACG GCCCCTCGGT GGCGGGCGCC TACCGGTTCC GGATGCGGCG CGGCAAGGCC 
GTGGTGATGG AGATCGAGGC GCGGCTGCAC CTGCGCCGGG ACGTCGGCCG CTTCGGGCTG 
GCGCCGCTCA CCTCGATGTA CTGGTTCTCC GAGACGGCCA AGCCCAGCGC CGTCGACTGG 
CGCCCCGAGG TGCACGATTC GGACGGGCTG GCCCTGTGGA CCGGGAGCGG CGAGCGCCTC 
TGGCGGCCCC TGCGCAACCC GCCCCGGACC ATGGTCTCGG CCTTCGTGGA CGCGCGGCCG 
CGCGGCTTCG GGCTGATGCA GCGCGACCGC CTGTTCGACC ATTACCAGGA CGGGGTCTAC 
TACGACCGCC GGCCCTCGCT CTGGGTCGAG CCGCTCGGGG ATTGGGGCCG GGGCAGCGTG 
CAGCTCATCG AGAACCCGAC CGACGACGAG ATCCACGACA ACGTCGTGGC CATGTGGGTG 
CCGGAGGAGC CGGCCCGGGC CGGCTCCGTG CACGACCTCG CCTACCGGCT GCACTGGGTG 
GCCGACGAGC CCTATCCGTC CGCGCTCGCG CGCTGCGTCG CGACCCGCGA GGGCAATGGC 
GGGCAGGCCG GGACGGAGCG CCCGAAGGGC CTGCGCAAGT TCGTGGTGGA GTTCCTGGGC 
GGGCCGCTGG CGCAGCTCCC CGCGGGCGTG AAGCCCGAGC CGGTGCTCAG CGCCTCCCGC 
GGCAGCTTCC CGCTCGCCCG CACGGAGGCG GTGCCGGACG ACGTGCCGGG CCATTGGCGC 
GCCGAGTTCG ACCTCGCGGT CACCGGGTCC GAGCCGGTGG AATTGCGGCT CTTCCTGCGC 
CAGGGCGACC GCACGCTCAG CGAGACCTGG ACCTACCAGG TCATCCCGGC GGCCTGA

Protein sequence

MLDRRRFLAA AALLAGGLPA RAAGLPLGAP SPFDFEALKA RARDLAAAPY RPPAIPDREV 
LQAIDYDAHG KLRFKPDHAL WAEGPGAFPV TFFHLGRYFQ KPVRMHLVEG GEAREIVYVQ 
DAFEMPADSP ARRLPPNPGF AGFRFQERRG GALDWRRNDW VAFLGASYFR AIGELYQYGL 
SARGLALDTV MPDRPEEFPD FTHVWFETPA PDSDTVTVMT LLDGPSVAGA YRFRMRRGKA 
VVMEIEARLH LRRDVGRFGL APLTSMYWFS ETAKPSAVDW RPEVHDSDGL ALWTGSGERL 
WRPLRNPPRT MVSAFVDARP RGFGLMQRDR LFDHYQDGVY YDRRPSLWVE PLGDWGRGSV 
QLIENPTDDE IHDNVVAMWV PEEPARAGSV HDLAYRLHWV ADEPYPSALA RCVATREGNG 
GQAGTERPKG LRKFVVEFLG GPLAQLPAGV KPEPVLSASR GSFPLARTEA VPDDVPGHWR 
AEFDLAVTGS EPVELRLFLR QGDRTLSETW TYQVIPAA