Gene Csal_0359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0359
Symbol
ID	4026027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	402108
End bp	403208
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	63%
IMG OID	637965508
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_572420
Protein GI	92112492
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGATA CGCTCACCCC GTCCCCCGAT ATCCCGCAGA CGATGCGCGC GATCGTCGCG 
TATGCGCCGG AGGACTATCG TCTCGAAGAA GTCGCGGTAC CCGAGATTGG CGAAAAGGAG 
ATTCTGATCA AGGTCGAGGC CTGCGGGATC TGCGCCGGTG ATCTCAAGGC GTACGAGGGG 
GCGCCGAGCT TCTGGGGCGA CGAGACGCAG CCGCCGTACA TCAAGGCGCC CATGATCCCG 
GGCCACGAGT TCGTCGGCCA TGTCGTCAAG CTGGGGCCTG GCGTCAAGGG ATTCGACATC 
GGCGACCGCG TGATCTCCGA GCAGATCGTG CCGTGCTGGG ACTGCCGTTT CTGCCATCGC 
GGCCAGTACT GGATGTGCGA AAAGCATGAC GTCTACGGCT TCCAGAACAA CGTCAACGGC 
GGCATGGCCG AGTACATGAA GTTTCCCCGA GAGGCCATCA ACCACAAGCT GCCGGAAAAC 
GTTCCGGTGG AGAACATCGT GCTGACCGAG CCGTTCTCCT GCTCGATGCA TGCGGTGGAG 
CGGGCACAGA TTCAACTGGG CGACGTGGTG GTCCTCTCCG GCGCCGGCAC CCTGGGGCTG 
GGAATGATCG GTCCCGCCAA GAAGTCCGGC CCTGCCAAGC TGGTGGTGCT GGATCTGCAC 
GGCGAGCGCC TGGAGCTGGC CCGCAAGTTC GGGGCCGATG TGGTGCTCAA CCCCAGCGAG 
GAAGACGTGG TCCAGATCGT CAAGGACATG ACCGACGGCT ATGGCTGCGA CATCTACATC 
GAGGCCACCG GCGCGCCCAA GTCCGTGGAG CAGGGGTTGG CGATGCTGCG CAAGCTGGGA 
CGTTTCGTGG AGTTCAGCGT GTTCAAGGAT CCGGTCACCG TGGACTGGAG CATCATCAGC 
GATCGCAAGG AACTGGACGT GCTCGGTGCG CACCTGGGGC CGTACTGCTA TCCGCACGTG 
ATCGAGGGCA TCGAGAGCGG CGATTTCCCC ACCGACGGGG TGGTGACCCA CAAGCTGCCG 
CTGGAGGATT TCCACAAGGG CATCGAGCTG ATGAGGCACG ACAGCAGCGC GCTCAAGGTC 
ATCCTCGTGC CCGGCGCCTG A

Protein sequence

MNDTLTPSPD IPQTMRAIVA YAPEDYRLEE VAVPEIGEKE ILIKVEACGI CAGDLKAYEG 
APSFWGDETQ PPYIKAPMIP GHEFVGHVVK LGPGVKGFDI GDRVISEQIV PCWDCRFCHR 
GQYWMCEKHD VYGFQNNVNG GMAEYMKFPR EAINHKLPEN VPVENIVLTE PFSCSMHAVE 
RAQIQLGDVV VLSGAGTLGL GMIGPAKKSG PAKLVVLDLH GERLELARKF GADVVLNPSE 
EDVVQIVKDM TDGYGCDIYI EATGAPKSVE QGLAMLRKLG RFVEFSVFKD PVTVDWSIIS 
DRKELDVLGA HLGPYCYPHV IEGIESGDFP TDGVVTHKLP LEDFHKGIEL MRHDSSALKV 
ILVPGA