Gene Rcas_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3042
Symbol
ID	5540538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3942789
End bp	3943814
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	640895161
Product	inosine/uridine-preferring nucleoside hydrolase
Protein accession	YP_001433114
Protein GI	156742985
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGC GCGTCATTCT CGACACAGAC CCCGGCATCG ATGATTCGCT GGCCATTCTG 
CTGGCAGTCG CCTCCCCCGA AGTCGAGCTT GCAGGCGTTA CCGTGACGAG CGGCAACTGT 
CCGCTCGCCG ACGGCGTGCG CAATGCGCGC AATGTGCTGG CGCTCGCCGG TCGTTCCGAT 
ATTCCGGTGT GCGGCGGCGT GTCATTGCCG CTCATCCGAC CGCTCTACAC CGCGCCCGAA 
ACCCACGGCG AAAGCGGCGT CGGTTTTGCC CGCCCGCCGG AGTCGCCCGC CCCGCTCCAC 
AGAGAGAACG GTGTGGACCT GATCATTCGT GAAATCCTGG AGCATCCTGG CGAGGTGACG 
CTCGTGGCCG TCGCGCCGCT CACGAATGTT GCTATTGCGG TGCGCAAAGA GCCACGCATC 
ATTAATGCCG TGCGTGAGGT CATTATTATG GGAGGCGCGC TGCGCGCCGA TGGCAATACC 
ACCTCCCTGG CGGAGTTCAA TTTTTATGTT GATCCGCACG CCGCACATAT CGTTCTTGAA 
AGCGGTATGC CGATTACGCT GCTGCCGTGG GACATTACGC AGCACATTAT TCTCACGCAG 
GCGGATGTTG ATCGCCTGAA CCGCATCTCG TCGCCAATCA CCCGCTTCAT TGCCGATGCC 
ACTCGTTTCT ACATCGAGTT TCATCTGGCA GCCTTCGGAT TTGCGGGGTG CTCAATCAAC 
GATCCGGCGG CGCTGGCACT GGCGTTTCTG CCCGATCTGG CGCGCACCGA ACCAATGCAT 
GTGGCAGTCG AGTATACGAG CGAACTGACC GCCGGCAAGA GCGTCATCAG TTACATCGGA 
CCGGCGACCC GTGAGCCGGA TGCGCACGAC CTGACCGGCT ACGACACCGC CCGATGGCCA 
CCGCAGTGGC GACACGCATT CCGCCCGGCG CCAAACGTGC GCGCAGTCGT TGACTTCGAT 
ACGCAACGTT TTCTCAATCT CTTTGTCGAA CGCATGGAAC ACCTGGCACA GACCGTATCT 
GTATGA

Protein sequence

MTTRVILDTD PGIDDSLAIL LAVASPEVEL AGVTVTSGNC PLADGVRNAR NVLALAGRSD 
IPVCGGVSLP LIRPLYTAPE THGESGVGFA RPPESPAPLH RENGVDLIIR EILEHPGEVT 
LVAVAPLTNV AIAVRKEPRI INAVREVIIM GGALRADGNT TSLAEFNFYV DPHAAHIVLE 
SGMPITLLPW DITQHIILTQ ADVDRLNRIS SPITRFIADA TRFYIEFHLA AFGFAGCSIN 
DPAALALAFL PDLARTEPMH VAVEYTSELT AGKSVISYIG PATREPDAHD LTGYDTARWP 
PQWRHAFRPA PNVRAVVDFD TQRFLNLFVE RMEHLAQTVS V