Gene RoseRS_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3989
Symbol
ID	5210972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4990126
End bp	4991415
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	62%
IMG OID	640597580
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001278286
Protein GI	148658081
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTATTAC GCCGAAGCAG GCATTCGTCA GTCGTGGAAA AATTTATTGC CGTCCGCAAG 
CGAACACGAA CCGCAGCATT TGCGCTGCAC AATGTCGCAA CTGCGGAAAA GCGCTCGGAG 
ATCATGCGCG ATGCGCAGAC ATCGCGCCGC ATGATGGAGT TGATCCGTCT CGGATTAAGG 
CCCCACCTGC CGGGTCAGCG GAAACCGGTC GGTCATGGGT TCGAGCGGCT GGGACACGTG 
AGTTGTTACA TCGTCAACGC GCCAACCGAT CGACAGGCTG AACAGGCGCG CGAGATACTC 
GCAGACGACT ACCTGATCGT TCCCGATGTG CCGCTCTCAC TGCCGGTTGC GCGCACCGGC 
GCCGAAACCA GGTTTCGCCG TCCGCGCGCA CCGGAGTGGC CCGACGTGAG CGGGATCCAG 
GAAGCGCATC GCAGAGGGAT TACCGGCGAA CAGGTGATTG TCGGCATACT CGATACCGGT 
TGTGACGCCG ACCACAACGA GTTTGCCGGG AAACGGATCG AGTTCCGGTA TGTGCCATTC 
GTGCCAACGC CCGAAAGTAT GCGCGCAGTC AACGGGTTCG ACACCCATGG TCACGGCACC 
CACGTGTGCG GCATTATCGC CGGGCGCAAC GTCGGCGTCG CGCCGGGTGT CGAACTGCTG 
GCAGCGGCGG TGATCGAAAG CGAGACGGTC AAAACCAGTC TGGAACGGAT CGTCGTCGCG 
CTGGACTGGA TGCTGTCCCA TTTCAGTCTG GCGGAAAACC AGCACAAACC GATGATCATC 
AGCATGTCGC TCGGTTTCCG CCCGGAATGG ATCAGCGCAC CGGCGTTCAA AACGGTGACC 
GATGGGATGC GACTGTTGCT GCGCACGCTG GTGGAGGATT TCGACGTGCT GCCGATCGTC 
GCCATTGGCA ACGACGGTCC CGGCGTCATT CGCGCACCCG GATCGTATGC CGAAGCGCTG 
GGGGTCGGCG CAGTCGATTT CGATCTCAAC CCCTGGCCCG GCAGCAGCAG CGGGCAGACG 
CCCGACGGAC GCCACAAGCC GGATATTGTC GGTTTTGGCG TCAACATTCT GTCGAGCCTG 
GAACGAGATC TTCAACGTCG CAGTCTATAC GCCAGGATGA GCGGCACGAG CATGGCAGCG 
CCATACGTGG CGGGCATCGC AGCGCTGATT GCTTCGGCAA ATCCCGGATT GCAGGGAGCG 
GCGCTGCGTC AGCGATTGCT GGAAACGGCG CTGCCGTTAT CGGCGCCCGC CGAACGGGTC 
GGCGCCGGGC TGGCGAGGTT TGTTGTATGA

Protein sequence

MVLRRSRHSS VVEKFIAVRK RTRTAAFALH NVATAEKRSE IMRDAQTSRR MMELIRLGLR 
PHLPGQRKPV GHGFERLGHV SCYIVNAPTD RQAEQAREIL ADDYLIVPDV PLSLPVARTG 
AETRFRRPRA PEWPDVSGIQ EAHRRGITGE QVIVGILDTG CDADHNEFAG KRIEFRYVPF 
VPTPESMRAV NGFDTHGHGT HVCGIIAGRN VGVAPGVELL AAAVIESETV KTSLERIVVA 
LDWMLSHFSL AENQHKPMII SMSLGFRPEW ISAPAFKTVT DGMRLLLRTL VEDFDVLPIV 
AIGNDGPGVI RAPGSYAEAL GVGAVDFDLN PWPGSSSGQT PDGRHKPDIV GFGVNILSSL 
ERDLQRRSLY ARMSGTSMAA PYVAGIAALI ASANPGLQGA ALRQRLLETA LPLSAPAERV 
GAGLARFVV