Gene Rcas_3133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3133
Symbol
ID	5540631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4060134
End bp	4061123
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	61%
IMG OID	640895254
Product	alcohol dehydrogenase
Protein accession	YP_001433205
Protein GI	156743076
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCAC ATGCGATCGT GTTCGTAGCG CCCAATCAGG TGCAGTGTGG CGCCATTGAT 
GTTCCCGAAC CGGCGCCAGG AGAACTGCTG ATCGAAGCGA TCTATACCTG TATCAGTCCT 
GGCACCGAAC TGCGCACACT TGCCGGTTTG CAGGCGGAAA CCCCGGGATG GCCATTGATA 
CCGGGATATG CAATGGTTGG TCGGGTCGTA GGCGCCGGTC CTGCGACCCC ATACACCGCT 
GGCGCGATCG TCTTCTGTAA AGGAACACGA TACGCTGGCG CGCACCTGAT GTGGGGCGCC 
CACCTCAGCC ATGCCGTGCT TCCTGCGGAA CAGGCGATCC CGCTGCCAGA CGGCATCGAT 
CTGCTGGAAG CCACGACCGC CAAATTGGCG GCAATCGCGT ATCGCGGGCT GACCATTGCA 
CATCCGTTGC CGCACGAAAC TGTCGCTGTC ATCGGACTGG GGATCATTGG TCAACTGGCT 
GCGAGACTAC ACGCACTCAA CGGCGCACGC GTTCTGGCGA CCGACCGCAC ACCGCAGCGC 
GTCGCGCTGG CGCAGCGCCA CGGTATCGAG GCATTCGTCG CCGAAGACAA TCTTGCAGCC 
GCCTTTCGCC AACGACTGAA CAGTGGCGTC GATATTATCG TCGACGCAAC CGGTGCGCCA 
TCAGTCATCA CAGAGGCTAT CGAACTGGCC AGAGACGTCC CGTGGGGCGA CGATCCTGGT 
GGCAATGCAC GATATCTTGT GCAGGGAAGC TACGCTGACT CGTTCTCTGT ACCCTATCAG 
GCAGCATTCC GCAAAGAACT GGCGATCCTT ATGACCCGCG ACGAAGGACC GCGCGACCTT 
CATACCGTGC TCAATCTGAT GCAGCGCAAC CGGTTGAAGA CTCGCGATCT GATCGGCGCG 
GTCGTGCCGC CCGAACGCGC TCCAGAGATC TACCGGACGT TACGAGAGCA GAGTGATATG 
GTAACGGCAG TGTTCCGGTG GAGTGCATAG

Protein sequence

MRAHAIVFVA PNQVQCGAID VPEPAPGELL IEAIYTCISP GTELRTLAGL QAETPGWPLI 
PGYAMVGRVV GAGPATPYTA GAIVFCKGTR YAGAHLMWGA HLSHAVLPAE QAIPLPDGID 
LLEATTAKLA AIAYRGLTIA HPLPHETVAV IGLGIIGQLA ARLHALNGAR VLATDRTPQR 
VALAQRHGIE AFVAEDNLAA AFRQRLNSGV DIIVDATGAP SVITEAIELA RDVPWGDDPG 
GNARYLVQGS YADSFSVPYQ AAFRKELAIL MTRDEGPRDL HTVLNLMQRN RLKTRDLIGA 
VVPPERAPEI YRTLREQSDM VTAVFRWSA