Gene Rcas_0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0807
Symbol
ID	5538273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1058852
End bp	1059892
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	640892959
Product	alcohol dehydrogenase
Protein accession	YP_001430942
Protein GI	156740813
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0463124
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCCA AAACAATGGC CGCGCTGGTT TGGTTGGGAC CGCGCAAGAT GGAGTTGCGG 
CATGAACCTG TGCCGACGCC GGGACCGGGC GAGGTGCTGG TCGCAGTTGC AGCGGTCGGA 
ATCTGTGGGT CGGAACTGAG TGGTTATCTG GGGCAGAACA GTCTGCGCCG ACCGCCGCTG 
ATTATGGGGC ACGAGGCGGC AGGACGGATC GCCTTCGACT ACGACACGCC GCTGAGCGAT 
GGCTCGCCGG CGCGGGCAGG CGCACGGGTC ACGTTCAATC CATTGCTGAC GTGCGGTGTG 
TGCGATCTCT GCCGGGCAGG GCGAAGCAAT CTGTGCCGCA ACCGGCAGTT GATCAGCGCT 
CACCGTCCGG GTGCATTTGC TGAGTATGTG TCTGTTCCTG CTCGTCTGTG CGTCCCTCTG 
CCGGATCATG TGTCGCTGAC CCTGGGTTCG CTCACCGAAC CGCTGGCGTG TAGCGTGCGC 
GCCGTGGCAC ATGCCGGAGC GCCGCGACGC CTCGTCATAC TCGGCGCCGG GCCAATTGGG 
TTGCTCTGCC TGGTTGCGGC GCGCGCTGCC GGCATCGAGT CCATCCTGGT GAGCGATGTG 
TCCGACCGCC GCCTGGCGGT TGCGCGCGCC TGGGGCGCAA CCGCAACCGT TAATGCCCGT 
GGTCATGTTC TGGCGGCGGT GCAGGAATTT GCGCCGGGCG GCGCTGATGC TGCCATTGAC 
GCTGTGGGGT TGACGGTGAC GCGCGAGCAG GCGGTGCGCG CCGTCATTCC CGGTGGGCGC 
GTCGTCTTCA TCGGATTGCA CGAAGAAGAG TCGATGGTTG CTGCCAATTA TATCGTGCGC 
CAGGAAATCA CCGTGACCGG CAGTTTCACC TACAGCGACG CCGACTTCAC GCGGGCGCTC 
GACCTGCTGG CGACCGGTTG GGTGACGCTC GACGATGACT GGCTCGAAGA GCGACCATTA 
GCGGCGGGAC CGGCGGCATT CGAGGAGTTG CTGGCGGGAA CGACGCGCGC GGCGAAGATT 
GTCCTGCAGA TGAGAGAATA A

Protein sequence

MQSKTMAALV WLGPRKMELR HEPVPTPGPG EVLVAVAAVG ICGSELSGYL GQNSLRRPPL 
IMGHEAAGRI AFDYDTPLSD GSPARAGARV TFNPLLTCGV CDLCRAGRSN LCRNRQLISA 
HRPGAFAEYV SVPARLCVPL PDHVSLTLGS LTEPLACSVR AVAHAGAPRR LVILGAGPIG 
LLCLVAARAA GIESILVSDV SDRRLAVARA WGATATVNAR GHVLAAVQEF APGGADAAID 
AVGLTVTREQ AVRAVIPGGR VVFIGLHEEE SMVAANYIVR QEITVTGSFT YSDADFTRAL 
DLLATGWVTL DDDWLEERPL AAGPAAFEEL LAGTTRAAKI VLQMRE