Gene Rsph17029_2994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2994
Symbol
ID	4899017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	1624
End bp	2730
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID	640113596
Product	glycosyl transferase, group 1
Protein accession	YP_001044867
Protein GI	126463754
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.767293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGAT CGGAACTGTC CCGCCTTGCC GTTGTCGTCA GCGGCTCCGT CCCTCCGGAC 
ACCCGGACCC GGATCGACCG GGGCGCAAAT CCCCGGCTCG ACTTCACCCA CCTTCAGAGC 
CTCGGCGCCA CGATCTTCAC CCGGGATTCG GCGCCCGAGG GCCGGGCCTT TCTCCGCCGA 
ACGCTGGGCG AGCGGTTCGC CCCGGCCGAA GCCGTGGCCG AGGCGGCCGA CCGGTTCGAC 
GCGATCTTCT GCGTGGCCGA AGACATCGGC GTGCCGGTGG CGCTGGCCCT GCGGCTCCGC 
GGCAAGCGGA CCCCGCTGCT CGTGGGGGTG CACGGACACT ACCTCGTCAA CCGCAAGTTC 
CGGCTCTGGG CGCTGGCCGC GCGCCACGAT GCGGCCACCC GCTTCCTGCC GCTGTCCGAG 
CCGATCCGGG CGCGGCTGAT CGCCGAATTC GGCATTCCGG CCAGCCGCTG CCACACGCTC 
TGCGTACCGA TCGACACCCG CTTCTTCGCG CCCGAGCCCG CGCCCGAGGC CGATCCGCCG 
ATGATCCTGA GCGCGGGCGC CGCACAGCGC GATTATCCCA CGCTCATCGC CGTGATGGAG 
GACGTGCCGG CGCGCTTCCG CATCGCCTCG GGGTCGAGCT GGATCGGCGA GGCCACGAAG 
CTCGCCGTGC CCGAGACCTG CACGATGGGC AGTGCGGGCT CGATGCCGGG GCTGCGCGCG 
CTCTATGCCG CCGCCGCCAT GGTGGTGCTG CCGCTGCAGG ATGTGGTTCA TGCCAGCGGC 
TATGCGGTGG CGATGGAGGC CATGGCCATG GGCAAGGCCC TGATCGTGAC GCGCACCGAG 
GCTCCGGCCG ATTTCTTCCT CGACGGCGAA ACCTGCCTGC TCGTACCGCC GGGCGACCCG 
GCCGCGCTGC GCTCGGCGAT CCTGCGTCTT CTCGAAAATG CCGACCTCCG CATGCGGCTG 
GGCCGTGCAG CGCGGCATCT GATGGAGGAG CGCTACGGGA TGGAGAGCTA CACGGCCGAT 
CTCGCGCGGC TTCTGACGGA TGTAAGCCGC CCGCCGGCGC AGGCACAGGA CCCGGGCCAC 
TGGGTCCGGC GGCCCCGGGG CGGCTGA

Protein sequence

MTRSELSRLA VVVSGSVPPD TRTRIDRGAN PRLDFTHLQS LGATIFTRDS APEGRAFLRR 
TLGERFAPAE AVAEAADRFD AIFCVAEDIG VPVALALRLR GKRTPLLVGV HGHYLVNRKF 
RLWALAARHD AATRFLPLSE PIRARLIAEF GIPASRCHTL CVPIDTRFFA PEPAPEADPP 
MILSAGAAQR DYPTLIAVME DVPARFRIAS GSSWIGEATK LAVPETCTMG SAGSMPGLRA 
LYAAAAMVVL PLQDVVHASG YAVAMEAMAM GKALIVTRTE APADFFLDGE TCLLVPPGDP 
AALRSAILRL LENADLRMRL GRAARHLMEE RYGMESYTAD LARLLTDVSR PPAQAQDPGH 
WVRRPRGG