Gene Bind_1805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1805
Symbol
ID	6201524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	2047940
End bp	2050165
Gene Length	2226 bp
Protein Length	741 aa
Translation table	11
GC content	59%
IMG OID	641705795
Product	glucosyltransferase MdoH
Protein accession	YP_001832922
Protein GI	182678776
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2943] Membrane glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.710428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCCC TGAACACATT CACCGACCAC GCTCATCTGG CCGATCAAAC GTTGTGGCAA 
GATCTCGAGG CTGCCGAGGG AAAAGAGGCG ATCCTTTCTT CTCCCTTCGC GGCAACGCCG 
CCAGAGATGC CCCTCACCAT GCCGGCACAA AACCTTGGTC GCTATGATCG GTCTCAACGC 
CGTTCCTGGC AAAAGAACCG GCCCCAGTTC TGGGTTTGGC TCGCGCGCCT CATCGTTTTC 
GGCGGCGGCC TTGCCTTAAC CGCCTATGGC GCCTGGCAAA TGTATCAAGT GGTGAGCCTC 
GGCGGCGTGA CGCCGCTGGA ATGGGTCCTG CTCGTTCTGT TCGTCGCCAA TTTCTCTTGG 
ATTGCGCTCG CCTTCACCGG GAGCATCGTC GGCTTTATCT GGCTCTTCGT GCGTCCGCCG 
GCCGATACGC CGACGCCAAA AACGTTGCGT GAAAAGACCG TCGTCGTGAT GCCGATCTAC 
AATGAGGCAC CGGCCCGTGT TTTCGGCGCC ATGCAAGCAA TTTTCGAGGA TGTCGAAGCC 
ACCGGGCTGG GTCAGGCCTT CGACTGGTTC TTCCTGTCAG ATACGACCGA CCCCGATATT 
TTCATCGCCG AAGAACAGGC TTTCATCGCT ATGCGCGAGC GGCTTGCGTC GAAATTCGGG 
TCAGCGCCGC GCCTCTATTA TCGCCACCGC CCCAAGAATA CAGCCCGCAA GGCCGGTAAT 
ATCGAGGATT TCGTCACCCG GTGGGGTGGC CTATACGCGC ATATGGTGGT GCTTGACGCC 
GATAGCCTGA TGACCGGCCA TGCCATCGTC ACACTTGCCG CGACAATGGA GGCCGACCCC 
GATTCCGGGA TCATCCAGAC ACTGCCCTTG ATCGTCAATC GCAACACGTT GTTCGCCCGT 
TTGCAGCAAT TTGCCGCGCG TATCTATGGT CCCGTCATCG CTGCCGGCGT CGCCGCCTGG 
ATGGGGCGCG ACGGCAATTA TTGGGGCCAT AATGCGATCA TTCGCATCAA AGCCTTTGCC 
GGTCATTGCG GCCTGCCGAC ACTCAAGGGC CGCCCGCCTT TCGGCGGCTT GATCCTCAGC 
CATGATTTCG TCGAGGCGGC CCTGATCCGC AGGGCCGGCT ACAGCGTCTA TATGCTGCCT 
ACCCTCGACG GCAGCTACGA AGAATCCCCG CCGTCCCTCA TCGATCTTTC GGCCCGCGAC 
CGGCGCTGGT GCCAGGGCAA TCTGCAACAT CTGCGGGTGA TCGGTTCGGC CGGCTTCCAT 
CTCGCCTCGC GTCAGCATTT CGCAACCGGC ATCATGGCTT ATGTCGCCTC GCCTTTATGG 
ATGGCGCAAT TGATCATCGG TATCATTCTG GTGATTCAAG CGAGTTACAT TCGGCCGGAA 
TATTTCACCA ACCAGTTCAC TCTCTTTCCA ACATGGCCTG TGTTTGATGC GAAACGGTCG 
CTCGAACTCT TCACATTGAC CATGGCGATC CTGCTCGCCC CGAAATTTCT CGGCCTGATC 
CTCGCCTTGA CACAAGGCAA AACCCGGCGT GGCAGCGGTG GCGCCCTGCC TCTCCTGATC 
TCCACGTTCT TCGAGATCAT CTTCTCGGCT TTGCTCGCAC CGATCATGAT GCTGATCCAG 
ACCGGCCATG TCATGCATTT CGCGTTCGGC TTTGATACAG GCTGGGATCC GCAGAGACGC 
GACGATGGCT CGATCCCCTT CAAGGCAATC GTGCGCCGGC ATCGGTCCCA TGTCGTCATG 
GGCGTGGTAA CGCTGATCGC AGGCTATATG ATCTCCCCTT CACTCATCGC CTGGATGTCA 
CCGACCATTG TCGGTCTGTT ATTGGCGATT GTCCTGTCAT GGAGCACGGG CCTGCTCGGT 
CTTGGTCTTG CTCTCCGCCG TGTGGGTCTT CTCCTCACGC CTGAAGAACA TGACAAGCCT 
AAGGTCGTCG AACGCGGCAA TGTGCTTGGC GAAGAGCTTG CGGCGGCTTC AGGGCACGTT 
TCCAATGCCT TGACGGTGGT CCATAACGAT GCGCGATTCC GTGCTTTCCA TTCAGCCTTC 
CTCTCGTTGG GACCGAAACG CCCCCGAGGG CAGATCACGC CCGAATGGGC GCTCGCCCAA 
GCCAAACTTG GAGAAGCGGC TTCTCTTGAA GAGGCAGTGA AATGGCTGCA GCCGAAGGAG 
CGTCTGGCGG CGGTGCAGGA TCCGACACTC ATTGCCCGTG TGGCCGAATT ACCGAAAAAG 
ACATAG

Protein sequence

MDALNTFTDH AHLADQTLWQ DLEAAEGKEA ILSSPFAATP PEMPLTMPAQ NLGRYDRSQR 
RSWQKNRPQF WVWLARLIVF GGGLALTAYG AWQMYQVVSL GGVTPLEWVL LVLFVANFSW 
IALAFTGSIV GFIWLFVRPP ADTPTPKTLR EKTVVVMPIY NEAPARVFGA MQAIFEDVEA 
TGLGQAFDWF FLSDTTDPDI FIAEEQAFIA MRERLASKFG SAPRLYYRHR PKNTARKAGN 
IEDFVTRWGG LYAHMVVLDA DSLMTGHAIV TLAATMEADP DSGIIQTLPL IVNRNTLFAR 
LQQFAARIYG PVIAAGVAAW MGRDGNYWGH NAIIRIKAFA GHCGLPTLKG RPPFGGLILS 
HDFVEAALIR RAGYSVYMLP TLDGSYEESP PSLIDLSARD RRWCQGNLQH LRVIGSAGFH 
LASRQHFATG IMAYVASPLW MAQLIIGIIL VIQASYIRPE YFTNQFTLFP TWPVFDAKRS 
LELFTLTMAI LLAPKFLGLI LALTQGKTRR GSGGALPLLI STFFEIIFSA LLAPIMMLIQ 
TGHVMHFAFG FDTGWDPQRR DDGSIPFKAI VRRHRSHVVM GVVTLIAGYM ISPSLIAWMS 
PTIVGLLLAI VLSWSTGLLG LGLALRRVGL LLTPEEHDKP KVVERGNVLG EELAAASGHV 
SNALTVVHND ARFRAFHSAF LSLGPKRPRG QITPEWALAQ AKLGEAASLE EAVKWLQPKE 
RLAAVQDPTL IARVAELPKK T