Gene Rsph17029_3146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3146
Symbol
ID	4898609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	168895
End bp	169911
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	67%
IMG OID	640113748
Product	ABC sugar transporter, periplasmic binding protein
Protein accession	YP_001045018
Protein GI	126463905
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.451363
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.179714
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGA CGGTGAGGCT GCTCGGCACG GTTGCCGCAG GACTGATGGC GGCCAATGTG 
GCCGCTGCTC AGGAGATCGC CTTCATCCCG AAGCTGGTCG GGGTGGGCTT CTTCACCTCG 
GGCGGCAACG GCGCGATGAA GATGGGCGAG GAGCTGGGCG TCAAGGTGAC CTACGACGGC 
CCGACCGAGC CCAGCGTCTC GGGGCAGGTC CAGTTCGTGA ACAACTTCGT CAACCAGGGC 
TACGGGGCCA TCGTGCTCTC GTCGGTCTCG CCGGACGGGC TCTGCCCCGC GCTGAAGCAG 
GCGATGGCCC GCGACGTGCT GGTGATGACC TGGGACAGCG ACGTGAACCC CGACTGCCGC 
TCCTACTACA TCAACCAGGG CACGCCCGAG CAGCTCGGCG GCCTTTTGGT CGACATGGCC 
AATGACGGGC TCGAGGGCAA GGAAAAGGCC AAGGTGGCCT TCTTCTATTC CTCGCCGACC 
GTCACCGACC AGAACGCCTG GGCCGAGGCC GCCAAGGCCA GGATCGCGGC CGACCATCCG 
GGCTGGGAGA TCGTGACCAC CCAGTATGGC TACAACGACG CGCAGAAGTC GCTGCAGACG 
GCCGAGAGCA TCCTGAGCGC CTATCCCGAT CTCGATGCGA TCATCGCGCC CGACGCGAAC 
GCGCTGCCGG CCTCGGCGCA GGCGGCCGAG AACCTCGGCC GGGCGGGCGA GGTGACGATC 
GTGGGCTTCT CGACGCCCAA CGTGATGCGC CCCTATGTGA AGCGCGGCAC CGTCGAGCGG 
TTCGGCCTCT GGGACGTGAC GCAGCAGGGG GCCATCTCGG TCGCCGTGGC GGCCCATGTG 
CTGAAGGACG GCCCGCTCAA TGTGGGCGAC AGTCTCGAGG TGCCGGGCAT CGGCTCGGTC 
GAGGTCTCGC CCAACTCGGT GCAGGGCTAC GACTACGAGG CCGAGGGCAA CGGCATCATC 
CTGCTGCCCG AGCGGACGGT CTTCACCGCC GAGAACATCG ACAACTTCGA CTTCTGA

Protein sequence

MRKTVRLLGT VAAGLMAANV AAAQEIAFIP KLVGVGFFTS GGNGAMKMGE ELGVKVTYDG 
PTEPSVSGQV QFVNNFVNQG YGAIVLSSVS PDGLCPALKQ AMARDVLVMT WDSDVNPDCR 
SYYINQGTPE QLGGLLVDMA NDGLEGKEKA KVAFFYSSPT VTDQNAWAEA AKARIAADHP 
GWEIVTTQYG YNDAQKSLQT AESILSAYPD LDAIIAPDAN ALPASAQAAE NLGRAGEVTI 
VGFSTPNVMR PYVKRGTVER FGLWDVTQQG AISVAVAAHV LKDGPLNVGD SLEVPGIGSV 
EVSPNSVQGY DYEAEGNGII LLPERTVFTA ENIDNFDF