Gene Rsph17029_1762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1762
Symbol	mdoG
ID	4895714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1858778
End bp	1860400
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	67%
IMG OID	640112356
Product	glucan biosynthesis protein G
Protein accession	YP_001043644
Protein GI	126462530
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3131] Periplasmic glucans biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.746379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCTC CTGCCGCCCC CTCCGCCCGC CTGAACAGGC GCTTGCTGCT CAGCGCGGCA 
AGTTCGTCGC TCGCCCTCGC TGCAAGCGGG CTCATGGGGC TGCCCCTCCG GGCTCAGGAG 
GCGCCTGCCG ACGCGCCCCC GGCCTCCGTT CCGGTCGCTG CGCCGCAGCA GTTCAGCTAT 
GACTGGCTGA CGGAAGAGAT GCGGGTCGCG GCCACGCAGC CGCATGTCGA ACCCGAGAAC 
CTGACGGGGT TCCTGGGCGA GCTGCAGTAC GACGATTACC GCTCGATCAA CTTCCGCACC 
GACCGCTCCC GCTGGGCGGA TACGGACAGC ATGTTCCGGA TCCAGGCCTT CCACCTCGGC 
TGGCTTTTCG GCGCTCCGGT CCGCCTCTAT GACGTGACCG ACGGCTATGT GCACGAGGTT 
CGCTTCTCGA CCGACGATTT CGAATACCGC AACGAACTGT CCACCCGCGT GGCGGCCCAT 
GTGGACCTGC CCGGCGTGGC GGGCTTCCGG CTGAACTTCC CGCTGAACCG GCCGGACGTC 
TTCGACGAGC TCGTGGCCTT TCTCGGCGCG AGCTACTTCC GCGCGCTCGG CCGCGGCAAC 
GGCTACGGCA TCTCGGCCCG CGGGCTGGCC GTCAACACGG CCACCTCCGC GCCCGAGGAA 
TTTCCCCGCT TCTCGCGCTT CTATCTCGAG CGTCCGCACG GCGGCGGCCT GTCGGCCGTC 
CTCTATGCCG CAATGGAGAG CCCGAGCGTC ACCGGCGCCT ACCGCTTCGT CATCACGCCC 
GGCATCGAGA CGATGATCGA AGTGACGGCG CGTCTCTTCT TCCGCAGCGC TGTGACCCAG 
CTCGGCGTGG CACCGCTGAC CTCGATGTTC CTCTTCAGCG AGAAGAACCG CGCCACCTAC 
GACGATTTCC GCCCCAACGT GCACGACAGC GACGGCCTGG CCGTCCGGCG CCGCGACGGC 
GACATCCTCT GGCGGCCGCT GAACAACCCG CCGCGGCTGG CCAGCAGCTA CTTCGGCGAG 
GAGAACCCGC AGGCCTTCGG CCTGCACCAG CGCAAGCGGT CCTTCGACGA CTATCAGGAT 
GCCGAAGCCC ATTACGAGCT GCGGCCCTCG GTCGATGTCG AGCCCATCGG CGACTGGGGC 
AAGGGGATGG TGCGGCTCGT CGAGATCCCG ACCCGCTACG AGACGAACGA CAACATCGTG 
GCCTTCTGGG TGCCGGAAGG GCAGATCTCC GCCGGCGATG CGCGCGAATT CGCCTACCGC 
CTTCGGTGGG GGGCTCTGCC CATCGAAGAG CCGTCCGACA TCGCCCACAT CTGGGAGACG 
CGGGCCGGTC ACGGCGGCGT TTCAGGGGTG GAGAATACGG GCGAGACCCG CAAGTTCGTC 
ATTGATTTCA AAGGGGGTCT GCTGGGCGGA CTTCCCGGGG ACGCCGAGGT GGAAGCCATC 
ACCTCCGTGC AGCACGGACA AATCGTCACG CAGACTCTTG AACGGCTGGA CGGGATGGAC 
ATATGGCGTC TCGTTCTCGA CGTGGCCGCA GCCGAGGGGG CCACGGTGGA ACTGGCGGCG 
CACATCGCCG GTTATGGACG GAAACTCTCG GAAACATGGC TCTATCAGTG GATGAAAGCC 
TGA

Protein sequence

MPAPAAPSAR LNRRLLLSAA SSSLALAASG LMGLPLRAQE APADAPPASV PVAAPQQFSY 
DWLTEEMRVA ATQPHVEPEN LTGFLGELQY DDYRSINFRT DRSRWADTDS MFRIQAFHLG 
WLFGAPVRLY DVTDGYVHEV RFSTDDFEYR NELSTRVAAH VDLPGVAGFR LNFPLNRPDV 
FDELVAFLGA SYFRALGRGN GYGISARGLA VNTATSAPEE FPRFSRFYLE RPHGGGLSAV 
LYAAMESPSV TGAYRFVITP GIETMIEVTA RLFFRSAVTQ LGVAPLTSMF LFSEKNRATY 
DDFRPNVHDS DGLAVRRRDG DILWRPLNNP PRLASSYFGE ENPQAFGLHQ RKRSFDDYQD 
AEAHYELRPS VDVEPIGDWG KGMVRLVEIP TRYETNDNIV AFWVPEGQIS AGDAREFAYR 
LRWGALPIEE PSDIAHIWET RAGHGGVSGV ENTGETRKFV IDFKGGLLGG LPGDAEVEAI 
TSVQHGQIVT QTLERLDGMD IWRLVLDVAA AEGATVELAA HIAGYGRKLS ETWLYQWMKA