Gene Rcas_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1174
Symbol
ID	5538640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1518896
End bp	1520263
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	60%
IMG OID	640893306
Product	extracellular solute-binding protein
Protein accession	YP_001431289
Protein GI	156741160
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.273661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.401546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGATGT GTCATTCTCC GCATGACCAT CTTCACAATC CGAAAGGCAG GGAAGCTATG 
TTCACGACAA AGTGGTTGAA ACTGTTCGGC GTCTTTTCGA TTCTCGCGCT CGTGCTGGCT 
GCCTGTGGCG GCGCACCGGC GACAACTCAG CCCACTGCCG CCCCGGCGCA ACCAACGACC 
GCACCGGCGC CGACCGGCGG CGGTAAACTC GAAATCTTCA GTTGGTGGAC AAATGGCGGC 
GAAGCCGATG GGCTGAACGC CATGTTCGAC ATCTACAAGC AGCAGAATCC TGGCATCGAA 
ATTGTGAATG CCACTGTCGC CGGGGGCGCT GGCACGAATG CCAAGACCGT ACTGAAGACT 
CGCCTTCAGG GTGGGCAACC GCCGGATAGC TGGCAGGTGC ATGCTGGCAA GGAATTGACG 
GCATATGTCG ATGCCGGTCA GATGGAACCG CTGACGCAGT TCTTCAAGGA GCAGGGCTTC 
GACAAGGTCA TGCCGCCGAA ACTGCTCGAA CAGATCACCT ACAACGGTGA AATCTGGTCG 
GTGCCGGTCA ATATCCACCG ATCGAACGTT CTCTGGTACA ACATCAAGAT TTTCCAGGAG 
AACGGTCTGA CCCCGCCCAA GACTATCGAC GACTTCTTCA CAGTGGCTGA GGCGCTTCAG 
GCGAAAGGCA TCATTCCGCT CGCAGTCGGC GGCAAAGACA AGTTCGAGAC GCCGCACCTG 
TTCGAGAGCG TGCTTCTGGC GGTCTTTGGA CCGGACGATT ACGCGAAACT GTTCCAGCCC 
GGCGCCGACT GGAGCGATCC GCGTGTTCGC CAGGCAGCCG AGATTGCGAA ACGAATGTTG 
GAGTACTCCA ACAGCGACCG CTCGTCGCTG GGATGGGCGG ATGCCGCACA ACTCGTGCTC 
GACGGCAAGG CGGCCATGAC CATTATGGGC GACTGGGCGC ATGGCTACTT CATCAGCAAG 
GGCGCGAAAG TCGGTGTTGA CTATGGCTAT GCCGCAGCGC CGGGCAACGA CGGCGTCTTC 
ATGTGGCTGT CGGACAGTTT TGGTCTGGCG AAGGGCGCGC CGAACCCGGA GCAGGCGAAG 
GCATGGCTGG CGCTCTGCGG CTCGCGTGAG GGGCAGGACG CCTTCAACCC GAAGAAAGGG 
TCGATCCCGG CGCGCACCGA TGCGAATGTG AGCCTGTACG ACGAGTATCT CCAGTACTCG 
ATCAAAGCCT TCGGCAGCGA GAAACTGGCG CCGAGCGTTG TTCACGGCGC GGCTGCTCCT 
GAAGCGTATA TGACCGAGTA CGGCAATGCC CTGAACGTCT TCGCCAGCGA CCTCGACGTT 
GATGCGGTCG TCGAGGCGTT GCAGGATGCT GCGAAAGACC TGAAGTAA

Protein sequence

MVMCHSPHDH LHNPKGREAM FTTKWLKLFG VFSILALVLA ACGGAPATTQ PTAAPAQPTT 
APAPTGGGKL EIFSWWTNGG EADGLNAMFD IYKQQNPGIE IVNATVAGGA GTNAKTVLKT 
RLQGGQPPDS WQVHAGKELT AYVDAGQMEP LTQFFKEQGF DKVMPPKLLE QITYNGEIWS 
VPVNIHRSNV LWYNIKIFQE NGLTPPKTID DFFTVAEALQ AKGIIPLAVG GKDKFETPHL 
FESVLLAVFG PDDYAKLFQP GADWSDPRVR QAAEIAKRML EYSNSDRSSL GWADAAQLVL 
DGKAAMTIMG DWAHGYFISK GAKVGVDYGY AAAPGNDGVF MWLSDSFGLA KGAPNPEQAK 
AWLALCGSRE GQDAFNPKKG SIPARTDANV SLYDEYLQYS IKAFGSEKLA PSVVHGAAAP 
EAYMTEYGNA LNVFASDLDV DAVVEALQDA AKDLK