Gene RoseRS_0263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0263
Symbol
ID	5207198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	331594
End bp	332913
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	640593892
Product	extracellular solute-binding protein
Protein accession	YP_001274648
Protein GI	148654443
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.962251
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00117926
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACACC GCCTCTCGCT GCGCTCCGCG CTCTGTCTGC TGACGCTGTC TCCATTGCTT 
GCCGCATGTG GCTGGTTTGC GCCGCCAACG CCGACGCCGA CGCCCGAACC GCGGGTGCTG 
CGGGTATACA CGGTGCGTGA CCCGACGATC GAAGGGGTCG TTGAGATTAT CAGCCAGGGA 
TTCCGTACCC GACATCCCGA TGTAACCATC GAATTCATCT ATGGCGATGG GAGTTATAGC 
GAATTGCAGG GCAGCGCAGC CACCGGCAAC ATCCCCGATG TCGTCTGGGC GCCGGACGTG 
ATAACGCCAG CGCTCATCGA GGCGGAACTG CTGCTCGACC TGGAAGAGTT CGCCAGGGGC 
GACGGAAGCG TCAATCTGGA AGACGTGCAT CCAGTAGCGC TTGAACCTGG ACGGTCGCGC 
GTTCGTCCCG GTCTCTACCT GATTCCCGCA TCCCTCGAAA CCATCCAGAT GTACTACAAT 
AGTTCCTTGT GGGAACGCTC CGGCGCGCCG TTGCCGCGCG ACGATTGGAC GTGGGACGAT 
CTGATTGCGG CATGTAAACG GGTGCAAGAA TCCACGCCGG GCGTCGATTG TCTGAGTTTC 
ACGAATAGCG GATTGTTCGA CCACACCGCA TGGGTGTACT GGCTGCCATG GGTGCGCGGC 
GCTGGCGGCG ATGCCCTCAG CGCCGACGGT GCGCAATCAA CGCTGAGTGC GCCGCAGTCG 
CTCGAAGGGT TGCAGGGGTA CCTCGACCTC TGGATCCGGC ACAAGATCGC GGCACAACCG 
GGCGCCAGCC AGGACGATTG TTTTGTTGCG CAAACGTGTG CGGCATTCTT CTCATTTGCC 
GGCGCCGCAC GGATCTACCG TGAGCAAATC GGCGACCGCT TCGCGTGGGA CGTACAGATT 
GTGCCAGCGC ATCGGGCAGG ACGTTTCACC GGTATCGGCT CATACGGCTT TGCCGTGACC 
CGCGCTTCTC GCGAGCCGCA ACTGGCATGG GACTTTGTGA AATATATCAT CACGCCGGAA 
GCGCAGCGCG CCATCGCTGC CGCCTATCTG GGCACGCCGG CGCTCCTGTC GCTGAGCAAC 
GATCCGGCGG TGGTGCAGTT GCCGCCGCCG CTGGCGAATA TGCGCGCCTT CGTTGTCGGG 
CGCGAGGCAG GCATTACGCC GCCGCGCTAC CCGACCGCCT GCGGCAGCGT CTACAACGGT 
CCGGTTTCCG CTGCTATCGC CGATGCACTC AATGCTGCAC TACGCGAAAC AGTGTCGGTG 
GAGGGCGCAT TTACTATTGC TGATCGCAAG ATACAGACCT GTCTGGACGC GAATCGGTAG

Protein sequence

MKHRLSLRSA LCLLTLSPLL AACGWFAPPT PTPTPEPRVL RVYTVRDPTI EGVVEIISQG 
FRTRHPDVTI EFIYGDGSYS ELQGSAATGN IPDVVWAPDV ITPALIEAEL LLDLEEFARG 
DGSVNLEDVH PVALEPGRSR VRPGLYLIPA SLETIQMYYN SSLWERSGAP LPRDDWTWDD 
LIAACKRVQE STPGVDCLSF TNSGLFDHTA WVYWLPWVRG AGGDALSADG AQSTLSAPQS 
LEGLQGYLDL WIRHKIAAQP GASQDDCFVA QTCAAFFSFA GAARIYREQI GDRFAWDVQI 
VPAHRAGRFT GIGSYGFAVT RASREPQLAW DFVKYIITPE AQRAIAAAYL GTPALLSLSN 
DPAVVQLPPP LANMRAFVVG REAGITPPRY PTACGSVYNG PVSAAIADAL NAALRETVSV 
EGAFTIADRK IQTCLDANR