Gene Rsph17029_2850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2850
Symbol
ID	4897487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	3008402
End bp	3010369
Gene Length	1968 bp
Protein Length	655 aa
Translation table	11
GC content	67%
IMG OID	640113453
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001044724
Protein GI	126463610
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTTAGAA GACAGGTCGG ACACGGGGCG CGACAAACGG TCGAAATAAC AACCGGGGCG 
GCAAAAGGGC AGGAATTCCA GGTGAAGAAA CTCCTTTTCG GTCTCGTTGA CCGGCTGACC 
AGAGCGCAGA AGCGTGGGCT TCTTCTTCTG GCGGATGTGC TCGTGGCGCC CCTTGCGCTG 
CTGATCACCG GCATCTTCAT CCGCGCCCCC GGAGGCGAGC ACGAGTGGCT TCTCTTCCCC 
GGCGCGGCGC TCTTTGCCTT CGGTCTCTCG CTGCTTTTCG GGATGCCCCG GATCAAGCTC 
AACGCCTATG AGACCATGGC CATCCTGAAG ACCGGCGCCT TCGCTGCGGT GCTGACCCTC 
GTGCTCTCGA TGCTCGCGTC GGTGGTGGGC ACCGCGGTGC CCGCGGCGGC GGCGATCCTC 
TTCGGCCTTC TGTTCTTCAT CCTGTCGGTC GGCGCCCGGA TGGTCATGCT GCATGCGCTG 
CTCTGGGTGC TGCAGATCGG CCAGAAGGGG TGCCGCGTGC TGATCTACGG CGCGGGCAAC 
ACCGGCACGC AGCTCGCGGC GGCGCTCCGC TCGCGCGGAA CGATCCGGCC CATCGCCTTC 
GTCGACGACA ATCCCGCGCT GCAGGCGATG GTGATCGCGG GGCTCCGCGT CTATCCGTCG 
GACCGGATCG AGCGGCTGGT GCGGGAGCGC GACGTGTCCC GTGTGCTTCT TGCCATGCCC 
TCGGAATCGC CCGCCAAACT TGCCCGGATC GCCCACCGGC TGCAGCTCGC GGGTGTCGAT 
GTTCACACCG TGCCCTCCTT CGCGCAGCTC GTGGGCGAGG AGCAGCTGGT CGACAACCTG 
TCTCCCTTCA CCTTCGGCCG TTTCCTCGGC CGCCAGCAGA TCGAGGATGC GCTGCCACAG 
GGGGCCGATG CCTATGTCGG CCGCACGGTG CTGGTCTCGG GCGCGGGCGG CTCGGTCGGA 
TCCGAGCTCT GCCGCCAGCT GCTGCTGATC CGTCCCCGGC GCATCGTCCT GTTCGAGATC 
AGCGAGATCG CCCTCTACAC CATCGACCGC GAGCTGCAGG CGATGGCCGA AGGCACCGGG 
GTCGAGATCG TGCCGGTCCT CGGATCGGTC ACCGATTCGC GGCTGTCGCG GATGGTGATG 
CAGGATCACG GGGTCGAGGT GGTGTTCCAT GCAGCCGCCT ACAAGCATGT GCCGCTGGTC 
GAGCACAATC CGATCGCGGG TCTGGCCAAC AATGTGCTGG GCACCCGGAC GCTGGCGGAT 
GCCGCGCACG AGGCCGGCGT GGCGCGCTTC ATCCTGATCT CGACAGACAA GGCGGTGCGC 
CCGACGAATG TCATGGGCGC CTCGAAGCGG CTGGCCGAGC TGGTGATTCA GGATCTCGCG 
AAGCGGTCGA AGAAAACGAT CTTTTCGATG GTGCGGTTCG GCAACGTTCT CGGCTCGTCG 
GGCTCGGTCA TCCCGCTCTT CAAGGAGCAG ATCGCCCGCG GCGGACCGGT CACGCTGACG 
CACGAGGATG TCACCCGTTT CTTCATGACC ATCTCGGAAG CGGCACGGCT GGTGCTGCTG 
GCGGGCTCCT TCGCCGATCC GGGCGATTGC CGTGGCGGCG ATGTGTTCGT GCTCGACATG 
GGCAAGCCCG TGCGCATCCG CGATCTCGCC GTGCAGATGA TCGAGGCGGC CGGCAAGTCG 
GTGCGCGATG AGCGCAACCC CTTCGGGGAC ATCGAGATTG TGGTCACGGG TCTGCGGCCC 
GGCGAGAAGC TGCACGAGGA GCTGCTGATC GGCGAGGGGC TGCTGACCAC GCCGCACTCG 
AAGATCCTGC GCGCTCAGGA GGAGAGCCTG TCCGAGCTCG AGATGGCCAC CGCGCTGCGG 
GCGCTGCGCA GTGCCATGGC GGCCGGAGAC CCGCAGGCGG CCCGCCGGGT CATACTCTCC 
TGGGTTGAGG GATATCGCCC TCCGGAAATC GTTGCCGCCG GGCGATAG

Protein sequence

MVRRQVGHGA RQTVEITTGA AKGQEFQVKK LLFGLVDRLT RAQKRGLLLL ADVLVAPLAL 
LITGIFIRAP GGEHEWLLFP GAALFAFGLS LLFGMPRIKL NAYETMAILK TGAFAAVLTL 
VLSMLASVVG TAVPAAAAIL FGLLFFILSV GARMVMLHAL LWVLQIGQKG CRVLIYGAGN 
TGTQLAAALR SRGTIRPIAF VDDNPALQAM VIAGLRVYPS DRIERLVRER DVSRVLLAMP 
SESPAKLARI AHRLQLAGVD VHTVPSFAQL VGEEQLVDNL SPFTFGRFLG RQQIEDALPQ 
GADAYVGRTV LVSGAGGSVG SELCRQLLLI RPRRIVLFEI SEIALYTIDR ELQAMAEGTG 
VEIVPVLGSV TDSRLSRMVM QDHGVEVVFH AAAYKHVPLV EHNPIAGLAN NVLGTRTLAD 
AAHEAGVARF ILISTDKAVR PTNVMGASKR LAELVIQDLA KRSKKTIFSM VRFGNVLGSS 
GSVIPLFKEQ IARGGPVTLT HEDVTRFFMT ISEAARLVLL AGSFADPGDC RGGDVFVLDM 
GKPVRIRDLA VQMIEAAGKS VRDERNPFGD IEIVVTGLRP GEKLHEELLI GEGLLTTPHS 
KILRAQEESL SELEMATALR ALRSAMAAGD PQAARRVILS WVEGYRPPEI VAAGR