Gene RoseRS_0803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0803
Symbol
ID	5207746
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	995605
End bp	996912
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	61%
IMG OID	640594419
Product	extracellular solute-binding protein
Protein accession	YP_001275167
Protein GI	148654962
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCAA CGAAGTGGTT GAAACTCATC AGCGCATTTG CGATCGTTAC ACTCGCGCTG 
GCAGCCTGTG GCGCGCCGTC CACCGCGCAA CCGACTGCTG CCCCCGCACA GCCGACGACT 
GCCCCCGCGC AGACCGGCGG CGGGAAACTC GAAATCTTCA GCTGGTGGAC GAACGGCGGT 
GAAGCGGATG GGCTGAATGC GATGTTCAGC ATCTATCAGC AGAAGAATCC CGGTGTCGAA 
ATTGTGAATG CCACGGTCGC CGGCGGCGCC GGCACGAACG CCAAGACGGT GCTGAAGACG 
CGCCTCCAGG GTGGTCAACC GCCGGATAGC TGGCAGGTGC ACGCCGGTAA AGAACTGACC 
GCATATGTAG ATGCCGGTCA GATGGAGCCG CTGACCCAGT TCTTCAAAGA GCAGGGTTTC 
GACAAGGTGA TGCCGCCGAA ACTGCTCGAA CAGATCACCT ACAACGGCGA AATCTGGTCG 
GTTCCGGTCA ACATTCACCG CTCGAACGTG CTCTGGTACA ACATCAAAAT CTTCCAGGAG 
AATGGTCTGA CCCCGCCCAA GACCATCGAC GACTTCTTCA TGGTCGCCGA GGCGCTCAAG 
GCAAAGGGGA TCATCCCCCT GGCAGTCGGC GGCAAGGACA AGTTTGAGAC GCCGCACCTG 
TTCGAGAGCG TGTTGCTGGC AGTTTTCGGA CCGGACGACT ACCCCAAACT GTTCCAGCCC 
GGCGCAGACT GGAGCGATCT GCGGGTGCGC CAGGCTGCCG AGATCGCCAA ACGCATGCTG 
GAATACTCCA ACAGTGATCG CTCCTCCCTC GGTTGGGCTG ACGCAGCGCA ACTGGTGCTC 
GACGGCAAGG CGGGCATGAC GATCATGGGC GACTGGGCGC ACGGCTACTT CATCAGCAAG 
GGCGCGAAAG TCGGCGTGGA TTACGGCTAT GCCGCAGCCC CCGGCAACGA CGGCGTCTTT 
ATGTGGCTGT CGGACAGTTT CGGGCTGGCG AAGGGTGCGC CGAACCCGGA GCAGGCAAAG 
GCATGGCTGG CGCTCTGCGG TTCGCGTGAG GGGCAGGATG CCTTCAACCC GAAGAAGGGT 
TCGATCCCGG CGCGCACTGA CGCCGATGTG AGCCTGTATG ATGAATATCT GAAGTACTCG 
ATCAAAGCCT TCGGCAGCGA GAAACTGGTT CCCAGCGTCG TGCATGGCGC TGCCGCTCCC 
GAAGCGTATA TGACCGAGTA CGGCAATGCG CTGAATGTCT TCGCCGGCGA TCTCGATGTT 
GATGCCGTCG TGCAGGCATT GCAGGACGCC GCGAAAGACC TGAAGTAG

Protein sequence

MLPTKWLKLI SAFAIVTLAL AACGAPSTAQ PTAAPAQPTT APAQTGGGKL EIFSWWTNGG 
EADGLNAMFS IYQQKNPGVE IVNATVAGGA GTNAKTVLKT RLQGGQPPDS WQVHAGKELT 
AYVDAGQMEP LTQFFKEQGF DKVMPPKLLE QITYNGEIWS VPVNIHRSNV LWYNIKIFQE 
NGLTPPKTID DFFMVAEALK AKGIIPLAVG GKDKFETPHL FESVLLAVFG PDDYPKLFQP 
GADWSDLRVR QAAEIAKRML EYSNSDRSSL GWADAAQLVL DGKAGMTIMG DWAHGYFISK 
GAKVGVDYGY AAAPGNDGVF MWLSDSFGLA KGAPNPEQAK AWLALCGSRE GQDAFNPKKG 
SIPARTDADV SLYDEYLKYS IKAFGSEKLV PSVVHGAAAP EAYMTEYGNA LNVFAGDLDV 
DAVVQALQDA AKDLK