Gene Rsph17029_3693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3693
Symbol
ID	4898199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	803212
End bp	804327
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	74%
IMG OID	640114301
Product	glycosyl transferase, group 1
Protein accession	YP_001045555
Protein GI	126464442
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.419352
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGGTG ATCCGGTCAT CGCCCGCCAC TACGGGCCGG GCGGGCGCGA GCATGGCGGC 
GGCATCGGCC GGCTGATCGG CTATGTGGTG GATGAGGCGG CGCGGCGCGG CGAGCGGCAT 
CTCGTCACCG ACACCCGCGG CGAGCGCCTC TCCCCCCGTT CGGCCCTGCG GTTCGCGGGC 
GCGATGGGGC GCATGGCGCT CGACCGGGCG ACGGCGCCCG ACCGGATCGC CCATATCCAC 
ATGGCCGGAC GCGGCAGCAC GGTCCGCAAA ATCCTGCTCT GCGGCTGGGC GCGCACCCTC 
GGATGCCGCC ATGTGCTGCA TCTGCACGAT TACCATTATG CCGCCGACTA CGAGGCGCGG 
CCGGGCTGGC AGCGGAGTCT GGTGCGCGCC ATGTTCGCCG GCGCCGACGC GGCGGTGGTG 
CTGGGCGACC CGGACCGCCG CCTCGCGGTG CAGAGGCTTC AGGCCGATCC CCACCGCGTC 
GTGGTCCTGC ACAATGCGGT GCCCGATCCG GGCGAGCGGC CCGCCCCGCC CCCCGGGCCG 
CCCTGCATCC TCTTTCTCGG CCGCCTGAGC GAGCGCAAGG GCGTGCCCGA ACTGCTTCAG 
GCGCTGGCCC GTCCGGGCAT GGCCTCGCTG CCCTGGCGGG CGGTGCTGGC GGGCGACGGC 
CCGGTCGAGG ACTACCGCCG TCAGGCCGAG GCCCTCGGTC TGGCCGGCCG GATCGAAATG 
CCGGGCTGGC TCGACCGCCC GGCCACCGAG GCCCTGTGCC GGCAGGCCGA TATCCTCGTG 
CTGCCCTCGC ACGCCGAAGG CATGTCGATG GCGGTGCTGG AAGGCATGGC CCACGGTCTC 
GCCGTCGTGA CCACGCCCGT CGGCTCGCAT CCCGAGGTGC TGCGCGACGG GGACAGCGGG 
CTCTTCGTGA AGCCCGGCGA CGTGCAGGCG CTGGCCGAGG CGCTCGACCG GCTTCTCAGC 
GCACCCGAGC TGCGCCGCGC CCTCGGCGCC CGCGCGCGGG CGCGGTTCCT ATCGGATTTC 
AGCATGGCGG CCTACGGACG GCAGCTCGAT CGCCTCTATG CGGCGATCGG AGCCGAGCGC 
GCTCCCGGCT CCGCAGGGGA AGGACAACGA CCGTGA

Protein sequence

MQGDPVIARH YGPGGREHGG GIGRLIGYVV DEAARRGERH LVTDTRGERL SPRSALRFAG 
AMGRMALDRA TAPDRIAHIH MAGRGSTVRK ILLCGWARTL GCRHVLHLHD YHYAADYEAR 
PGWQRSLVRA MFAGADAAVV LGDPDRRLAV QRLQADPHRV VVLHNAVPDP GERPAPPPGP 
PCILFLGRLS ERKGVPELLQ ALARPGMASL PWRAVLAGDG PVEDYRRQAE ALGLAGRIEM 
PGWLDRPATE ALCRQADILV LPSHAEGMSM AVLEGMAHGL AVVTTPVGSH PEVLRDGDSG 
LFVKPGDVQA LAEALDRLLS APELRRALGA RARARFLSDF SMAAYGRQLD RLYAAIGAER 
APGSAGEGQR P