Gene Rsph17029_0190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0190
Symbol
ID	4896593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	208585
End bp	209592
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	69%
IMG OID	640110773
Product	glycosyl transferase family protein
Protein accession	YP_001042081
Protein GI	126460967
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.801609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCG CAGTCATCAT CCCCTTCTAT CAGCGGGAGG CGGGGATCCT CTCTCGCGCG 
CTCGACTCGG TCGATGGGCA GATCCTTCCC GAAGGCCATA GCCTCACCGT CTTCGTCATC 
GACGACGAGT CCCCCGTGCC CGCCCGGTCC GAGGTCGAGG GGCGGCAGGG CAAGGTTCCC 
GTGCGGCTGA TCGCCCAGAA GAACGGCGGC CCCGGTGCCG CGCGGAACGC GGGGCTCGAT 
GCCGTGGCGG CGGAGGGCTT CGACCATGTG GCCTTCCTCG ATTCCGACGA CATCTGGCAA 
CCGACCCATC TCGCGGATGC GCTCGATCTG CTCGCGCGGG GCTACGACTT CCATTTCTGC 
GACCACCAGC GCACCGACGA CGACATCACC TATTTCGAGC GCACCCCCGC CCTGCGCCGG 
ATGCGCGAGG AGCGGCACGC GGGCGTCACC GTGCTCGATG CCGAGGCACC GATCCTCGCC 
TTCGACCAGC CCTCGATCAT GGCGGCGTCG GTCGATACCT ACCTCAGCCA GACCTCGACG 
GTCGTGGTGC GGCAGAGCTT CGTCGAGACG CTGCGCTTCG ACCCGCGGCT GCGGAACGCC 
GGCGAGGACC AGCTCTTCTG GCTGTCGCTG ATCGCGGCCG GGGCGCGCAC CGTCGTTTCG 
TGGAAGATGA ACGTGCTCTG CGGCCGGGGC GTGAACGTCT ATTTCGACGC GTTCGACTGG 
AAATCCACCA AGGTGGTGGA CCGCACGGGC TACATGCTGA TGTTCTTCCA CACGGTCGGC 
CGGCGGCTCT CGCTGACGGC GTCCGACCGC CGGACGGTGG CCGACCGCAT CCGCCGCTAC 
CGCCGCGCCT ACAGCTACCT CTTCCTGCGC GCGCTCCTGC AGGGCCGGGT GCCGACGCTC 
TCGCTCACCT GGAAGCTCGC GGCGCTGGAC CCGGGGCTCG TGCCCGCCAT GCCGCTGCGG 
TTCCTGGCGG TGCTGCCCAA CCGCGAGGCC GAGAGCCAGC AGTGGTAG

Protein sequence

MRTAVIIPFY QREAGILSRA LDSVDGQILP EGHSLTVFVI DDESPVPARS EVEGRQGKVP 
VRLIAQKNGG PGAARNAGLD AVAAEGFDHV AFLDSDDIWQ PTHLADALDL LARGYDFHFC 
DHQRTDDDIT YFERTPALRR MREERHAGVT VLDAEAPILA FDQPSIMAAS VDTYLSQTST 
VVVRQSFVET LRFDPRLRNA GEDQLFWLSL IAAGARTVVS WKMNVLCGRG VNVYFDAFDW 
KSTKVVDRTG YMLMFFHTVG RRLSLTASDR RTVADRIRRY RRAYSYLFLR ALLQGRVPTL 
SLTWKLAALD PGLVPAMPLR FLAVLPNREA ESQQW