Gene Csal_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1091
Symbol
ID	4028013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1233857
End bp	1234885
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	65%
IMG OID	637966268
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_573146
Protein GI	92113218
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCGC TTGTCTATGA GGGAGTGGGG CAGAAGGCCT GGAAAGAGAA GGATCGGCCC 
GCAATCGAGC AAACCACGGA TGCCATCGTG CGGGTGACGT ATACCACCAT TTGCGGCACC 
GACCTGCACA TCCTCAAGGG CGATGTGCCG GCGGTGACGC CGGGGCGCAC CCTGGGCCAT 
GAAGGCATCG GGGTGATCAA GGAAGTTGGC GGGGCCGTCA GCGGCCTCGC GGTCGGCGAT 
CAGGTGCTGA TCTCGTGCAT CACGTCGTGC GGGCACTGCG ATTACTGCAA GCAGGGCATG 
TATGCGCATT GCCGCGATGG CGGGTGGATT CTCGGTCACA AGATCGATGG CACCCAGGCC 
GAGGTGGTGC GCATTCCGCA TGCCGCCAAC AGCCTGTACC GGTTGCCGCC GGGGCTGGAG 
CCCGCCGCGG CGCTGATGCT GAGTGACATC CTGCCCACCG GCCACGAGAT CGGCGCGTTG 
AACGGAGAGG TCTCGCTGGG GGATACCGTG GCCATCGTCG GCTCGGGCCC CATCGGGCTG 
GCCGCCTTGT TGACCGCGCG CTTCTATTCG CCGGGGCGCA TCATCATGGT CGACCCGGAC 
GAGAATCGCC TGGCCGTGGC GCGGCAACTG GGCGCGACCG ACACCGTCAG TACCGATCCG 
GTGGAGACGG TCATGTCGCT TACCGACGGC GAGGGCGTCG ACGTGGCCAT GGAGGCCGTG 
GGTATCCCCG AGACGTTCGA TACCTGCCAG CGCATCCTGC GTCCGGGCGG GCGGCTCGCC 
AACATCGGCG TGCATGGCCG CAGCGTCGAA CTGCGCCTCG AGGAGCTGTG GATCAAGAAC 
GTCACGGTCC GCACCGGGCT GGTGAATACC AATACCATTC CCGTGCTCAT GCGGTTTCTC 
GAGACCGGCG GCATCGATGC CGAAAGCCTG ATCACCCACC GCTTCGCGCT GGACGAGATC 
GAAAAGGCGT ACGAGGTGTT CTCGCGTGCC GCGTCGGAAA AGGCCATCAA GATGCTGCTG 
ACCGCCTGA

Protein sequence

MKALVYEGVG QKAWKEKDRP AIEQTTDAIV RVTYTTICGT DLHILKGDVP AVTPGRTLGH 
EGIGVIKEVG GAVSGLAVGD QVLISCITSC GHCDYCKQGM YAHCRDGGWI LGHKIDGTQA 
EVVRIPHAAN SLYRLPPGLE PAAALMLSDI LPTGHEIGAL NGEVSLGDTV AIVGSGPIGL 
AALLTARFYS PGRIIMVDPD ENRLAVARQL GATDTVSTDP VETVMSLTDG EGVDVAMEAV 
GIPETFDTCQ RILRPGGRLA NIGVHGRSVE LRLEELWIKN VTVRTGLVNT NTIPVLMRFL 
ETGGIDAESL ITHRFALDEI EKAYEVFSRA ASEKAIKMLL TA