Gene Rcas_0274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0274
Symbol
ID	5537736
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	340472
End bp	341791
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	640892438
Product	extracellular solute-binding protein
Protein accession	YP_001430425
Protein GI	156740296
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.285114
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTGGC CTGTGTTGGT GCGCCGGGGA TGGCTGGTCG TGCTGTCCTC CCTGCTCCTG 
GTGTCGTGCG GGTTGCTCGA ACCGCCGCCG CCGACTCCGA CGCCTGAGCC GCGCGTGTTG 
CGCGTCTACA CTGTGCGCGA CCCCGCTATC GAGGGGGTGG TTGAGATTGT CAGCCAGGAG 
TTTCGCCGTC GTCATCCCGA CGTGCAGATT GAACTCATCG ACGGCAGCGG CGATTATAGC 
GAATTGCGAG GCAGCGCCGC AGCCGGCAAC GTTCCCGATG TCGTCTGGCT GATCGATATG 
CTGACCGAGT CGCTGCTCGA GTCTGATCTA ATCATCGATC TGGAAGAATT CGCCAGAGGC 
GACGACAGCG TCAACCTGGC AGATGTGCAT CCGATGGCGC TGGAACTCGG ACGATCCCGC 
AAGCGCCCTG GTCTGTTCAT GATTCCGGTA TCGCTCGAAA CCATTCAGAT GTATTACAAC 
CGTTCGCTCT GGGAACAATC CGGCGCGCCG CTGCCGCGCG ATGACTGGAC ATGGGATGAT 
CTGATCGCAG CGTGCAAACG CCTTCAGGGG GCGGCGCCAG GGGTTGATTG CCTGAGTTTC 
ACGAATGCCA GCCTAAACGG CTACGCCTGG TGGGTTTACT GGCTGCCGTG GGTGCGCGGC 
GCTGGCGGCG ATGCGCTCAG CGCTGACGGA ACGCAATCAA CGTTGAGTTC GCCGCAGTCG 
CTCACAGGGT TGCAGGCATA TGTCGATCTC TGGCTCACGC ACAAAATCGC AGCCCCACCC 
GCTTCTGGCG GACGCGACTG CTTCGTGGAT CAGACGTGCG CTGCATTCTT TTCGTTTGCC 
GGCGTTGCGC AGCGGTACCG CGATCAGATC GGCGACCGCT TCGCCTGGGA TGTGCAATTG 
GTTCCGAGCC ATCCGGCAGG ACGCTTCACC GGCATCGGCA CGTATGGCTT CGCCGTAACG 
CGCGCCTCGC GCGATCCGCA ACTGGCATGG GATTTTGTGA AAATCTTTAT TGCTCCAGAA 
ACGCAGCGTG CGCTGACGGC TGCACATCTG GGCACGCCGG TGCTCCTGTC GTTGAGTAAC 
GATCCGACAA TGATGCAACT GCCCGCGCCA CCGGCGAACA TGCGCGCGTT TGTGATCGGG 
CGCGAGGCAG GTATTGCACC GCCGCGCTAC CCGACGGCAT GCGGCAGCGT CTACACCGGT 
CCGGTGGCGT CGGCTCTCGA TGACGCGCTC AACGCCGCAG TGCGCGGGTT GGCGTCCGTC 
GAGGGGGCGT TTGCGGTTGC AGACCGCAAG ATACAGACAT GCCTGGATGC GAATCGGTAG

Protein sequence

MQWPVLVRRG WLVVLSSLLL VSCGLLEPPP PTPTPEPRVL RVYTVRDPAI EGVVEIVSQE 
FRRRHPDVQI ELIDGSGDYS ELRGSAAAGN VPDVVWLIDM LTESLLESDL IIDLEEFARG 
DDSVNLADVH PMALELGRSR KRPGLFMIPV SLETIQMYYN RSLWEQSGAP LPRDDWTWDD 
LIAACKRLQG AAPGVDCLSF TNASLNGYAW WVYWLPWVRG AGGDALSADG TQSTLSSPQS 
LTGLQAYVDL WLTHKIAAPP ASGGRDCFVD QTCAAFFSFA GVAQRYRDQI GDRFAWDVQL 
VPSHPAGRFT GIGTYGFAVT RASRDPQLAW DFVKIFIAPE TQRALTAAHL GTPVLLSLSN 
DPTMMQLPAP PANMRAFVIG REAGIAPPRY PTACGSVYTG PVASALDDAL NAAVRGLASV 
EGAFAVADRK IQTCLDANR