Gene Rcas_1222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1222
Symbol
ID	5538689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1579902
End bp	1581395
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	61%
IMG OID	640893355
Product	aldehyde dehydrogenase
Protein accession	YP_001431337
Protein GI	156741208
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAACTC CTCCAGTATA CCAGAACCTG ATCGGCGGCA AGTTTGTCGA CTCCGCAAGC 
GGACGAACGT TCGAGAACCG CAACCCGGCG GACACGCGCG AGATTATCGG CATTTTCCAG 
GACAGTGATG AGCGCGACGT ACAGGCGGCG GTCGAGGCGG CGAAGCGGGC ATACCGTTAC 
TGGCGGCTGG TTCCCGCGCC GAAGCGTGGC GAAATCCTGT TCAAAGCCGC GCAGCTGCTC 
GTTGAGCGCA AAGAGCAGTA CGCCCGTGAC ATGACTCGCG AGATGGGCAA GGTGCTCAAG 
GAAACACGCG GTGATGTGCA GGAAGCCATC GACATGTGCT TCTTTATGGC GGGTGAAGGG 
CGGCGCCTCT ATGGCCAGAC AACCCCCTCC GAAATGCCAA ACAAGTTCCA GATGTCGGTA 
CGCCAGCCGG TCGGCGTCTG CGGGCTGATC ACGCCATGGA ACTTCCCGAT GGCGATTCCG 
TCCTGGAAGA TCCTGCCAGC ACTGATCGTT GGCAACACGG TGGTCATCAA ACCCGCCTCC 
GACACGCCGC TGTCGGTGTA CAACCTGGTC CAATGCCTGC TCGACGCCGG CATTCCCGAC 
GGCGTGATCA ACATCGTCAC CGGCAGCGGA AGTCGCGTTG GCGAGCCGCT GATTCGCCAT 
CCCGATGTAC AAGTCATTTC CTTTACCGGT TCGACCGAGA TCGGCAGCAA AGTCGCGCGC 
GTCGGGGCCG AGGGGATGAA ACACGTCTCG CTGGAGATGG GCGGCAAAAA CCCGATGATT 
GTGATGGACG ACGCCAACCT CGACCTGGTC GTCGATGGCG CGATCTGGGG CGCCTTCGGC 
ACGACCGGTC AGCGCTGCAC CGCCACCTCG CGGCTGATCG CCCACCGCGC CATTGTGGGC 
GAACTGACCG AGCGCCTGGC GGATCGCGCT GAGCGACTGA AGATCGGCAA CGGGCTTGAT 
GAAACCGTCG AGATGGGACC ATCGATCAAC CAGAGCCAGC TCGAAACGGT GCAGCGCTAC 
GTCGAAATTG GTGCGAGCGA AGGGGCGCGG CTGGTTGTCG GCGGGCGGAC GCTGCGAGAT 
GGCGATTACG CCTATGGGTT CTTCCATCAG CCGACGATCT TTGCCGATGT GCAGCGTCAC 
ATGCGTATTG CCCAGGAAGA GATTTTCGGT CCGGTGCTGT CGATCATCAC AGTCGATAGC 
CTGGAAGAGG CGATTGATGT CGCCAACGAC GTGCCGTATG GATTGTCGTC TGCGATCTAC 
ACCCGCGACG TGAATGCCGC ATTTCGCGCT ATGCGCGACC TGTACACCGG CATCGTGTAC 
GTGAATGCGC CAACGATTGG CGCGGAAATC CATCTCCCCT TCGGCGGCAC CAAAGGCACC 
GGCAATGGGC ACCGCGAAGG CGGCATTCAG GTGCTCGACG TCTTCAGCGA GTGGAAATCG 
ATCTACGTCG ATTTTTCGGG CACGCTCCAG CGTGCGCAGA TTGATAATTA TTGA

Protein sequence

MSTPPVYQNL IGGKFVDSAS GRTFENRNPA DTREIIGIFQ DSDERDVQAA VEAAKRAYRY 
WRLVPAPKRG EILFKAAQLL VERKEQYARD MTREMGKVLK ETRGDVQEAI DMCFFMAGEG 
RRLYGQTTPS EMPNKFQMSV RQPVGVCGLI TPWNFPMAIP SWKILPALIV GNTVVIKPAS 
DTPLSVYNLV QCLLDAGIPD GVINIVTGSG SRVGEPLIRH PDVQVISFTG STEIGSKVAR 
VGAEGMKHVS LEMGGKNPMI VMDDANLDLV VDGAIWGAFG TTGQRCTATS RLIAHRAIVG 
ELTERLADRA ERLKIGNGLD ETVEMGPSIN QSQLETVQRY VEIGASEGAR LVVGGRTLRD 
GDYAYGFFHQ PTIFADVQRH MRIAQEEIFG PVLSIITVDS LEEAIDVAND VPYGLSSAIY 
TRDVNAAFRA MRDLYTGIVY VNAPTIGAEI HLPFGGTKGT GNGHREGGIQ VLDVFSEWKS 
IYVDFSGTLQ RAQIDNY