Gene Rsph17029_2842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2842
Symbol
ID	4897432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2995763
End bp	2996788
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	640113445
Product	D-xylose ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001044716
Protein GI	126463602
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID	[TIGR02634] D-xylose ABC transporter, substrate-binding protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATAAGG CCCTTTTGGC CGCCGTGGTC GCCACGGCCG GCTTTTCCTC TGCCGCGCTC 
GCCCAGGATC TGACGGTCGG CGTCAGCTGG TCGAACTTTC AGGAAGAACG CTGGAAGACC 
GACGAGGCCG CGATCAAGGA GGCCCTCGAA GCGGCGGGCG CCACCTATGT CTCGGCCGAC 
GCGCAATCCT CCTCGGCCAA GCAGCTGTCC GACGTCGAGG CGCTGATCTC GCAGGGCGTC 
GATGCGCTCA TCATTCTGGC GCAGGATGCC GACGCCATCG GCCCGGCCGT GCAGGCGGCC 
GCCGACGAGG GCATTCCGGT CGTGGCCTAT GACCGGCTGA TCGAGGACAA CCGCGCCTTC 
TACCTGACCT TCGACAACGT CGAGGTGGGC CGCATGCAGG CCCGCGCCGT GTTCGAGCAG 
GCGCCGAAGG GCAATTATGT CATGATCAAG GGCAATGCCG CCGACCCGAA CGCCGACTTC 
CTGCGCGGCG GCCAGCAGGA GGTGCTGCAG AAGGCCATCG ACGCGGGCGA CATCACCATC 
GTGGGCGAGG CCTATACCGA CAGCTGGCTG CCCGCCAACG CCCAGCGGAA CATGGAGCAG 
ATCCTGACCG CCAACGACAA CAAGGTCGAT GCGGTCGTGG CCTCGAACGA CGGCACCGCG 
GGCGGCGCCA TCGCCGCGCT GACGGCGCAG GGGATGCAGG GCATTCCGGT CTCGGGTCAG 
GACGGCGACC ATGCGGCGCT GAACCGGATC GCCAAGGGCA CGCAGACCGT CTCGGTCTGG 
AAGGACTCGC GCGAGCTGGG CAAGGCCGCC GCCGAGATCG CCGTGGCGAT GGCCAAGGGC 
ACCGAGATGG AAGGCGTCGA GGGCGCCCAG AAATGGACCT CGCCCAAGGG CACCGAGATG 
AACGCCGTGT TCCTCGAGCC CATCGCCATC ACCAAGGACA ACCTCTCGGT CGTCGTGGAT 
GCGGGCTGGA TCGGGAAGGA CGCGCTCTGC CAGGGCGTCT CGAACGGCCC GGCCCCCTGC 
AACTGA

Protein sequence

MHKALLAAVV ATAGFSSAAL AQDLTVGVSW SNFQEERWKT DEAAIKEALE AAGATYVSAD 
AQSSSAKQLS DVEALISQGV DALIILAQDA DAIGPAVQAA ADEGIPVVAY DRLIEDNRAF 
YLTFDNVEVG RMQARAVFEQ APKGNYVMIK GNAADPNADF LRGGQQEVLQ KAIDAGDITI 
VGEAYTDSWL PANAQRNMEQ ILTANDNKVD AVVASNDGTA GGAIAALTAQ GMQGIPVSGQ 
DGDHAALNRI AKGTQTVSVW KDSRELGKAA AEIAVAMAKG TEMEGVEGAQ KWTSPKGTEM 
NAVFLEPIAI TKDNLSVVVD AGWIGKDALC QGVSNGPAPC N