Gene RoseRS_3714 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3714
Symbol
ID	5210693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4649284
End bp	4650453
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	62%
IMG OID	640597307
Product	2-alkenal reductase
Protein accession	YP_001278018
Protein GI	148657813
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00887093
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAAACC GCTCCGGCGA GAAACGTTCC CCCTGTGTGA TCTATGCGCT CCTTGGCGGA 
TTGAGCCTGG TGAGCGGCGT TGTCGGCACA CTTGTCGGCG GTGCGTTGAT CTGGTTCTTT 
GTTGCGCGCC CGATTGCCGA TCAAACAGCG CAGACGACCG TACCAGCCAC GCTCCCCTCC 
ACCCTTCTCC CATCTCCAAC ACCGCTGGTC GTCGCCACGG ACGATCCGGT GCGCACGGCG 
CCGGCGCGTA TCGCGCGCGA GGCAGGACCA TCGGTGGTGA CGGTGGTGTC GCAGTTGCCG 
CCGCAGGTCG GTTTCTTCGG CACATTCCAA CCGCCGCCAG CGCGTGGTTC AGGAGTGATT 
ATCGATCCGC GCGGGTACAT TATCACCAAC CACCACGTGG TTGAAGGCGC GCGGCAGTTG 
TACGTCATTC TTGCCGACGG ACGACAGCGC CCGGCGCAAT TGATCGGGAG CGACTACCCG 
TTCAGCGATC TGGCGCTGAT CAAGATCGAA GGCGATACCT ATCCCGCAGC CCGGTTGGGC 
GACTCTGACG CAGTCCAGGC AGGCGATTGG GTGGTTGCCA TCGGCAGCGC CCTGGGCGAC 
CTGCGCAACT CGGTAACGGT CGGTGTGGTC AGCGGGCTTG GACGGTCGCT GCAAACCCGC 
GACGTCGTAC TGGACGACCT GATCCAGACG GATGCAACTA TCAACCGCGG TAACTCTGGC 
GGTCCATTGT TGAACCTGGA TGGCGAGGTG ATCGGGATCA ATACGGCGAT CATACGCGGC 
GGCGCCGAAC AGGCGGAAGG GATCGGGTTC GCCATTCCCA GTAACACCGT GCGCTATGTC 
GCCGATCAAC TGATAACACG CGGCAGGGTG GCACGTCCAT ACCTGCCGAT CGAATTCGTA 
CCGATTACGC CGCGTCTGGC GGCGTGGTAC AACCTGCCGG TCGATTACGG TCTCTTTATT 
CAGGCGGTCA GGCGTGGATC GGCGCTGGCG CAGGCTGGTG TGCAACCGGG TGATATCCTG 
TTATCACTCG GCGGTCAGCG CATCGATGAA GCCCATCCGT TGCTGCGTGT GCTGGCGCGA 
CATCAGGTTG GCGAAGAGGT CGAGATCGAG ATCTGGCGTG ACAACGCCAT ACAGACAATA 
CGGATCACGC TGGAAGAATT GCCCCGCTGA

Protein sequence

MENRSGEKRS PCVIYALLGG LSLVSGVVGT LVGGALIWFF VARPIADQTA QTTVPATLPS 
TLLPSPTPLV VATDDPVRTA PARIAREAGP SVVTVVSQLP PQVGFFGTFQ PPPARGSGVI 
IDPRGYIITN HHVVEGARQL YVILADGRQR PAQLIGSDYP FSDLALIKIE GDTYPAARLG 
DSDAVQAGDW VVAIGSALGD LRNSVTVGVV SGLGRSLQTR DVVLDDLIQT DATINRGNSG 
GPLLNLDGEV IGINTAIIRG GAEQAEGIGF AIPSNTVRYV ADQLITRGRV ARPYLPIEFV 
PITPRLAAWY NLPVDYGLFI QAVRRGSALA QAGVQPGDIL LSLGGQRIDE AHPLLRVLAR 
HQVGEEVEIE IWRDNAIQTI RITLEELPR