Gene Rsph17029_3700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3700
Symbol
ID	4898996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	811358
End bp	812566
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	71%
IMG OID	640114308
Product	glycosyl transferase, group 1
Protein accession	YP_001045562
Protein GI	126464449
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.820196
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC TTCTGTCCCC GACCGCCGCC CGTGCGGCGC TCTCCGAGCC GCCGCGGGCC 
GAGCGTCCCG CGCCGTCCGC GGCCCGTCCG CTTGCGCAGG CGCCCCTGCG GATCCGCACC 
GGGCACAGCT ACCATGTCTA TTTCACCATC GCGCTCGGCC AGCGGAACGC GCGCTTCGTC 
GAGCGGGCGA TGACCCCGCT CAACCGCTAC TTCGCCTTCG CGGATTCCTT TGCCCTGACG 
CCCGAGCCCG GCTTCGATGC GATCCACGCC TGGAACGCGG TGCCGCTGCT GACCCGGCGG 
CCCTTCATCC TCACCTTCGA GGATTACATG CCCCGAACGC CGGACGACCG GCGCATTCCC 
TGGGTCGAGC GGGCGCTGAC GCGGATCCTG CTCGGCGACC GGTGCCGCGG GCTTGTCGCC 
ACCTCGGATT ATGCGCTGCG GCAGTTCCGC TGGCAGCACC GCGCGAACCC GCGCCTGCCT 
GAGCTGCTGG CCAAGACCGA GCGCCTCTAT CCGGTGACGC CGCCCCGCCG CGACCGGCCG 
AAGCCGCACT CCGACCGGCT GCGGCTGCTG TTCGTCGGGC GCGACTTCAT GCGCAAGGGC 
GGTCCCGCGC TGATGGAGGC GCATGCGAGG CTGCGGGCGC AGGGCGTGCC TGTCGAGACC 
ACGGTCGTCT CGGCGCTGCA GTGGTCGCCG CGCGACTATA TCGGTCCGCC GGATGCGGCC 
TATGTCGCCG AGTGCCATGC CCGTCTGGAC CAGGAGGGGG TGATCTGGCA CCGGTCCCTG 
CCGAGTGCCG AGGTCCACCG GCTGATGGAT GCGGCGGACT ATCTGATCTT CCCGACCTTC 
CACGACACGT TCGGCTTCGT GACCCTCGAG GCCTTCGCCG GTGCCACGCC GGTCATCGCC 
AGCGACACCT GCGTCCTGCC CGAGCTGATC GTGCCGGGCG AGAACGGCTT TCTCCTGCCG 
TTCGAGAACG ACGGGATCGG CAAATGGGCC TGGCTCTACC GGCAGGCCGA GGCGGGCTAT 
CTCGAGGCCT ACCGTGCGCA GGCCGGGCGT CTGGCGGAAG GGCTGGTCGA GACCTTGGGC 
CGGGCCTGGG ACGGGCGCCG TGATTATGAG CGGCTCAGCG CGGGCGCGCT GGCGGCGGCG 
CAGACGCGGT TCCACCCGGA CACGGCGCGG CGGCGGCTCG AAATCCTCTA CGAGCGGTTC 
CGGGCGTGA

Protein sequence

MSDLLSPTAA RAALSEPPRA ERPAPSAARP LAQAPLRIRT GHSYHVYFTI ALGQRNARFV 
ERAMTPLNRY FAFADSFALT PEPGFDAIHA WNAVPLLTRR PFILTFEDYM PRTPDDRRIP 
WVERALTRIL LGDRCRGLVA TSDYALRQFR WQHRANPRLP ELLAKTERLY PVTPPRRDRP 
KPHSDRLRLL FVGRDFMRKG GPALMEAHAR LRAQGVPVET TVVSALQWSP RDYIGPPDAA 
YVAECHARLD QEGVIWHRSL PSAEVHRLMD AADYLIFPTF HDTFGFVTLE AFAGATPVIA 
SDTCVLPELI VPGENGFLLP FENDGIGKWA WLYRQAEAGY LEAYRAQAGR LAEGLVETLG 
RAWDGRRDYE RLSAGALAAA QTRFHPDTAR RRLEILYERF RA