Gene RoseRS_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3337
Symbol
ID	5210314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4186392
End bp	4187798
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	62%
IMG OID	640596935
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_001277648
Protein GI	148657443
COG category	[S] Function unknown
COG ID	[COG3379] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.912336
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACATC CCCGACTACT CATCATCGGT CTCGATTGCG CCGAGCCGTC GCTGGTGTTT 
GATCGCTGGC GCGCCGATCT GCCTGCCCTC AACCGCCTGA TGACAGAGGG AGTCTACGGT 
GAACTGGAGA GTTGTATTCC GGCGATCACC GTCCCTGCCT GGAGTTGCAT GATGAGCGGG 
CGCGACCCGG GTGAACTTGG CGTCTATGGG TTTCGCAACC GCGTTGATCG CTCCTATGGT 
CGCATGGTTG TTGCCGATAG CCGTGCGATC CGGTTTCCGC GTTTGTGGGA TATTCTCGGC 
GAGGCGGGAT GGCGCGTGGC AGTGATCGGC GTGCCCGGCG CCTATCCGCC GTCCGCTGTG 
AATGGCGCGC TGGTTTCCTG CTTTCTTGCG CCTTCGACCG ATGTGACCTA TACCTTTCCG 
CCAGCGCTCG CAGAACGTCT TGCCGTCTGG GCAGCGAAAG CGACGCCAGG GCGCGCCTAT 
CTGCTCGATG TGCCCGATTT CCGCTCCGAT GACAAAGAGC GCATTGTGCG CGACATCTAC 
GCCATGTGCG ATCAACGTTT CGCGGTTGCC GCAGCATTGA TCGAGGAAGA TCATCCCGAC 
TTTCTCATGC TGGTGGACAT GGGGGTCGAT CGCATCCACC ACGCGCTCTG GAAGCATATG 
GACCCGCGGC ATCCGTTGTT TGTGCCCGAT TCGCCCTTTG CAGATGCGAT TCATGCGTAC 
TATCGCCACG TAGATGCACA GATCGCCGCT TTGCTGACGC ACTGCGGACC TGAGACGGCA 
GTGCTGGTGG TGTCTGACCA TGGTGCGCGT CCGCTGATGG GTGGGGTGCG GATCAATCAA 
TGGTTGATCG CGCAGGGTGA CCTGACGTTG CACACAATGC CGGACGTGCC AACCAACCTC 
GATCAGGTGG ATGTTGACTG GTCGCGCACC CGCGCCTGGG GTGCGGGCGG CTACTACGGG 
CGTATCTTTC TCAATGTGCG CGGGCGTGAG CCGCAGGGCG TCATTCCGCC AGCAGAGTAC 
GAACGTGTGC GCGCCGACCT TGCGGCGCGT CTGGAAGCGA TGCCCGGTCC AGATGGTCAT 
CCGCTCGGAA ACAGGGTCTT TGTGCCACAG CGCCTCTATC GCGTCGTGCG AGGCGTTGCC 
CCTGACCTGA TCGTCTACTT CGGCGATCTT GCCTGGCGGG CAGTGGGAAC GGTTGGTGGC 
GATGGGATAT TCACCCAGGA AAACGACACC GGTCCCGATG ACGCCAATCA CGCGCAGCAT 
GGACTGTTCA TCTGGCGCGA CCCGCAGCGC CCCGGCGGCG GGCGGCGACT CGACAATGCG 
CAGATTTACG ATATACTGCC TACCCTGTTG AGACGGTTCA ACATGCCGGT CCCTGCGGGA 
CTGCGCGGTA CGATGCTGGA ACTATGA

Protein sequence

MTHPRLLIIG LDCAEPSLVF DRWRADLPAL NRLMTEGVYG ELESCIPAIT VPAWSCMMSG 
RDPGELGVYG FRNRVDRSYG RMVVADSRAI RFPRLWDILG EAGWRVAVIG VPGAYPPSAV 
NGALVSCFLA PSTDVTYTFP PALAERLAVW AAKATPGRAY LLDVPDFRSD DKERIVRDIY 
AMCDQRFAVA AALIEEDHPD FLMLVDMGVD RIHHALWKHM DPRHPLFVPD SPFADAIHAY 
YRHVDAQIAA LLTHCGPETA VLVVSDHGAR PLMGGVRINQ WLIAQGDLTL HTMPDVPTNL 
DQVDVDWSRT RAWGAGGYYG RIFLNVRGRE PQGVIPPAEY ERVRADLAAR LEAMPGPDGH 
PLGNRVFVPQ RLYRVVRGVA PDLIVYFGDL AWRAVGTVGG DGIFTQENDT GPDDANHAQH 
GLFIWRDPQR PGGGRRLDNA QIYDILPTLL RRFNMPVPAG LRGTMLEL