Gene Rcas_4422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4422
Symbol
ID	5541935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5684675
End bp	5685646
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	60%
IMG OID	640896520
Product	aldo/keto reductase
Protein accession	YP_001434456
Protein GI	156744327
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000370601
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.543562
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACA TACCACTGTC TCTGCCACGT CGTCCATTGG GTCGCACCGG GTTTCAGGTG 
ACGCCGCTCT GTGTCGGGTG CGCACCGCTC GGCAATATGC CCGAAACGTT CGCTTACAGC 
GTTGCCGAGG ATCAGGCAAT TGCAACCCTG CTCGAAGCCT TCCGCAGTCC GATCAATTTT 
TTCGACACTG CCGCGATCTA CGGCGATGGT GAGAGTGAAC GCCGGATCGG CAAGGTCCTC 
GCAATGATTG GCGGGTTGCC AGATGGCGTT GTGCTGGCAA CGAAAGCCGA CCGTGATGCG 
GCAACCGGCG ATTTTAGCGG CGACCAGATC AGGCGCTCGG TCGAGCGTAG CCTGACGTTG 
TTGGGTCTGG ATCGCCTGCA GTTTGTGTAC ATCCACGACC CGGAGCATAC GACGTTCGAG 
AATGTTATGG GCAAAGGCGG ACCATTGGAG GTCTTGCAGC GGTTCCAGGC AGAAGGGATC 
ATCGCGCATA TCGGCATTTC CGGCGGTCCG ATTGACATGC TCATTCGTTA TGTCGAAACC 
GGCGCATTTA TGGCAGTTGA GACGCATAAC CGCTATACCC TGCTGAACCG CTCGGCAGAA 
CCGCTCCTCG ATGTGGCAGT CAGTCGGGGT GTCGCGGTAG TGAATGCAGC ACCATATGGC 
AGTGGTATTC TCGCCAAAGG ACCGGACGCT TACGCGCGCT ACGCCTATCA GGACGCGCCA 
CCGGCGCTTG TTGAGCGGGT GCGCGCTATG GCGGCGGTCT GCCAGGAGTA TGGTGTTCCG 
CTGGCGGCTG CGGCATTGCA GTTTTCCTTG CGCGATCCGC GCATCACCTC GACCGTTGTC 
GGCGTCAGTA AGCCAGAACG CATCGCCGCC ACCCTGGACC TGGCGCGCGT CCCAATTCCC 
GACGACCTCT GGCAGCGCCT TGATGCCGTG GGGTTCGACA CGAACGACCC GGAGGAGCAT 
CGGTTCAAGT GA

Protein sequence

MIDIPLSLPR RPLGRTGFQV TPLCVGCAPL GNMPETFAYS VAEDQAIATL LEAFRSPINF 
FDTAAIYGDG ESERRIGKVL AMIGGLPDGV VLATKADRDA ATGDFSGDQI RRSVERSLTL 
LGLDRLQFVY IHDPEHTTFE NVMGKGGPLE VLQRFQAEGI IAHIGISGGP IDMLIRYVET 
GAFMAVETHN RYTLLNRSAE PLLDVAVSRG VAVVNAAPYG SGILAKGPDA YARYAYQDAP 
PALVERVRAM AAVCQEYGVP LAAAALQFSL RDPRITSTVV GVSKPERIAA TLDLARVPIP 
DDLWQRLDAV GFDTNDPEEH RFK