Gene RoseRS_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4005
Symbol
ID	5210988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5010167
End bp	5011336
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	60%
IMG OID	640597594
Product	extracellular solute-binding protein
Protein accession	YP_001278300
Protein GI	148658095
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID	[TIGR01096] lysine-arginine-ornithine-binding periplasmic protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.431376
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTG CGCTCGGATG GCTGCTTGTT ATTCCGCTGT TGCTGGCAGC ATGCGGTCAG 
CAGGCAGCAC AGACGGGGCA ACCCGTCGAA GTCACCCGCA TTGTCGAAGT CACCCGCGTC 
GTTGAAGTCA CCCCTGCAGG CGGAGCGGCT CTGGTTCAAC CGGCAGCAAC CCCCGCTCCC 
GCTCCGGCGC CTGCCGCGCC AGCCGGTTTC GGTGAGACGC TCAAGGCGAT CCAGGCGCGC 
GGCAAACTGA TCTGCGGCGT CAACAGCCAG GTGCCCGGTT TTGGTTTCGT TGACCCGACC 
GGTGCGTTTA GCGGGTTCGA CATCGACTAC TGCAAGGCGC TGGCAGCAGC GATCTTCAAC 
GATGTCAGCA AAGTGGAGTA TCGCCCGCTG ACTGCCGAGC AGCGTTTTGC CGCACTCCAG 
AGCGGTGAAA TCGATGTGCT CATCCGCAAC ACCACCTGGA CGCTCACCCG TGATACCGAT 
AACGGCGGCA ACTTTGTCGC TACCACGTTC TACGATGGTC AGGGCATCAT GGTACCGAAA 
GCCTCGAACA TCACGAAACT CGAAGATCTG AACGGTGCGA CCATCTGTGT GCAGAAGGGG 
ACCACGACAG AGTTGAACCT GGCGGATCAG ATGGCGGCGC GTAAACTTCA GTACACCCCT 
GCCGTCTTTG AAGACGCCAA CAGCACCTTC GCCGCATATG CAGAAGAGCG CTGCGATGCG 
GTGACAACCG ATAAATCCGG TCTGGTATCG CGCCGGTCGG TGCTGCCGAA CCCGGATGAT 
CACGTCATCC TCGATGTCAC CCTGTCGAAG GAGCCGCTCG GTCCAATGGT GCGCCAGGGT 
GATGATCAAT GGTTCGACAT TGTGCAGTGG ACGGTGTTTG CCACCTTCGC CGCCGAGGAG 
TTCGGCATCA CGTCACGGAA TGTCGATCAG GCGAAGGAGA GCGATACGCG CCCCGAAGTG 
CGGCGGTTGC TCGGCGCCGA TCCGAATGTG GACCTGGGCG CCAAACTGGG CTTGAGCAAG 
GATTGGGCTG CGAATGTGAT CAAGTCGGTC GGCAACTATG CCGAAATCTA CGACCGCAAC 
CTGGGACCGA ATACGAAGAC GGCGATTCCG CGCGGTATTA ATAACCTGTA CACGCAGGGC 
GGGTTGCTCT ACGCGCCGCC GTTCCGGTAA

Protein sequence

MKRALGWLLV IPLLLAACGQ QAAQTGQPVE VTRIVEVTRV VEVTPAGGAA LVQPAATPAP 
APAPAAPAGF GETLKAIQAR GKLICGVNSQ VPGFGFVDPT GAFSGFDIDY CKALAAAIFN 
DVSKVEYRPL TAEQRFAALQ SGEIDVLIRN TTWTLTRDTD NGGNFVATTF YDGQGIMVPK 
ASNITKLEDL NGATICVQKG TTTELNLADQ MAARKLQYTP AVFEDANSTF AAYAEERCDA 
VTTDKSGLVS RRSVLPNPDD HVILDVTLSK EPLGPMVRQG DDQWFDIVQW TVFATFAAEE 
FGITSRNVDQ AKESDTRPEV RRLLGADPNV DLGAKLGLSK DWAANVIKSV GNYAEIYDRN 
LGPNTKTAIP RGINNLYTQG GLLYAPPFR