Gene Bind_3438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3438
Symbol	mdoD
ID	6201465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	3904009
End bp	3905646
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	60%
IMG OID	641707385
Product	glucan biosynthesis protein D
Protein accession	YP_001834484
Protein GI	182680338
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3131] Periplasmic glucans biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGAA AATCATTTGA GTCCGAGAGC GTTGGCTTGT GCCGGCACCG CCGCGACGTC 
TTGAAAGCCC TGACGGCTTT CGGTCTCCTG TCCCAAAGTT CGGCTTTTCT TCGCGCTGAT 
CCCGCGAAAA ACCCCTCACA ACTGGGATTA CGGCTTGGAC CAGCCGAGCC CTTTTCTTTC 
ACCCTCTTGA AGGATCTGGC GCGTCGACGC GCCGCCGCCC CCTATTCGCC ACCCCCGGAA 
ATCGATCCCG ATATCATCGC TCAACTCGGT TATGACGCCT GGGGCGAGAT TAGTTTCGAC 
ATGGATCACG CCTTATTCGC CGAAGGGCCC GGTCGCTTTC CGGTCAGTTT CTTCCCGCTC 
GGCAATTTCT TCCACAAATC GGTCGCGATG CATGTCGTCG CAAATGGCAC GGCGCGAGAG 
ATCCTTTATG ATCCCTCTTA CTTCCAAATG CCGGCGGACT CACCGGCGCG GCGCCTGTCG 
CCAAACGCCG GCTTTGCCGG TCTGCGCATC CAGGAGGCCC GCGATGGTGC CCTTGATTGG 
CGCCATAATG ATTGGGTAGC CTTTCTCGGC GCGTCCTATT TCCGGGCGAT CGGCGCCCTG 
CATCAATATG GCCTTTCGGC GCGTGCTGCC GCTCTCGACG TCGCAGTCGC CGGCCATGCC 
GAGGAATTTC CCGATTTCAC GGGTTTCTTC ATCGAACAGG ATGAGACCCG CGACGGCCTG 
ACGATCTATG CGCTGCTGGA AAGCCCTTCG CTAACGGGCG CCTGCCGCTT TGTCCTGACG 
CGCGATAAAG GCGTCACGAT GCATGTGGAC CAGACGCTCT CTATCCGTAA GCCCGTCACC 
CGTTTCGGTC TCGCGCCCCT GACTTCGATG TTCTGGTTCT CCGAAACCGT CAAGCCGACC 
GCCGTCGATT GGCGACCGGA AGTGCATGAT TCCGATGGGC TTGCGATCTT CACGGGCAAT 
GGCGAGCACC TCTGGCGGCC GCTCAACAAT CCGCCGCGCA CCATGGTCTC CTCGTTTATC 
GATCAGCATC CGCGCGGCTT CGGCCTGTTG CAGCGGGATC GCATTTTCGA TCACTACTTG 
GACGGGGTGC GCTATGATCT CCGTCCGAGC CTCTGGGTCG AGCCCCTGGG CGAGTGGGGC 
AAAGGCGCGG TCCAGCTCGT CGAAATTCCG ACCAACGACG AAATCCACGA CAATATCGTC 
GTCATGTGGG TGCCGGAGCA GCCCATGACG GCCGGAACCG AATTAAACCT CGCCTATAAA 
CTCTATTGGC AGGCCGATGA GCCCTTTCCG AGCCCGCTTG CACGCTGCAT CGCGACACGG 
CTCGGCAATG GCGGGCAGCC TGGCCAACCA CGGCCGAAAA GCATCCGCAA ATTCATGGTC 
GAATTTTTGG GCGGCCCCCT CAAGGACCTC CTTCCCGGTG AAAAGCCAGA GGCCGTTCTC 
TGGGCCTCGC GCGGCGGCTT TTCCTATATT TTTACCGAAG CCGTGCCCGA TGACGTGCCG 
GGCCATTGGC GGGCGCAATT CGACTTCACC GACAGCGCCC CGGCCGACAC AAACGATCCC 
GTCGAAATGC GCCTCTATCT CAAAACCGGC AACAAAGTGC TGAGCGAGAC CTGGGCCTTT 
CAATATCACC CGTTCTGA

Protein sequence

MSGKSFESES VGLCRHRRDV LKALTAFGLL SQSSAFLRAD PAKNPSQLGL RLGPAEPFSF 
TLLKDLARRR AAAPYSPPPE IDPDIIAQLG YDAWGEISFD MDHALFAEGP GRFPVSFFPL 
GNFFHKSVAM HVVANGTARE ILYDPSYFQM PADSPARRLS PNAGFAGLRI QEARDGALDW 
RHNDWVAFLG ASYFRAIGAL HQYGLSARAA ALDVAVAGHA EEFPDFTGFF IEQDETRDGL 
TIYALLESPS LTGACRFVLT RDKGVTMHVD QTLSIRKPVT RFGLAPLTSM FWFSETVKPT 
AVDWRPEVHD SDGLAIFTGN GEHLWRPLNN PPRTMVSSFI DQHPRGFGLL QRDRIFDHYL 
DGVRYDLRPS LWVEPLGEWG KGAVQLVEIP TNDEIHDNIV VMWVPEQPMT AGTELNLAYK 
LYWQADEPFP SPLARCIATR LGNGGQPGQP RPKSIRKFMV EFLGGPLKDL LPGEKPEAVL 
WASRGGFSYI FTEAVPDDVP GHWRAQFDFT DSAPADTNDP VEMRLYLKTG NKVLSETWAF 
QYHPF