Gene Csal_1187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1187
Symbol
ID	4026998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1361382
End bp	1362911
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	65%
IMG OID	637966364
Product	aldehyde dehydrogenase (acceptor)
Protein accession	YP_573242
Protein GI	92113314
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCACT CCACCCCTTC AAACCCTGTC ACTCACGCCG ATTGGCAGGC CCTGGCCGAG 
CACCTGACTG TCGAAGCAGG CCTCGAGGCG CGTGCCTATA TCGATGACAC CTTCGTCGAT 
GCCGCCGATG GCGCGACCTT CACCACGCTC AATCCGGCCA CCGGCGAGAC GCTCGCCGAA 
GTGGCCAGTT GCGATGCGGC CGACGCCGAG ACGGCGGTGT CGGTGGCGCG GCGTGCCTTC 
GAGAGCGGCG CGTGGTCGCG TTCGTCACCG GGCGAACGCA AGGCCGTGCT GCTGCGTCTG 
GCCGACCTGA TGGAGGCGCA CAAGCACGAG CTGGCGCTGC TCGACAGCCT GGACATGGGG 
AAGCCGGTAT CGAGTGCCAT GGGCGACATG GCCGGTGCCA TCGGTTGCAT TCGTCACCAT 
GCCGAGTCCA TCGACAAGCT CTATGGTGAA ATCGCGCCCA CCGGCGAGGA AAGCCTGGGG 
CTGGTTCTGC GCGAGCCGCT GGGTGTGGTG GCGTCGATCG TGCCCTGGAA CTTCCCGTTG 
ATGATGACGG CCTGGAAGAT CGGCCCGGCG CTGGCGGCTG GCAACAGTGT CATCCTCAAG 
CCGTCGGAAA AATCACCGCT TTCGGCGTTG CGCCTCGCCC AGCTGACGCG CGAAGCCGGC 
TTGCCGCGCG GCGTTTTTCA GGTACTGCCC GGCTTCGGTC ATACCGTGGG CAAGGCCTTG 
GCATTGTCCA TGGGGGTCGA CTGTCTGGCC TTTACCGGCT CCACCGGGGT CGGCAAGCAA 
TTGATGCAGT ACGCCGGTCA GTCGAATCTC AAGAAGGTCT TTCTGGAGTG TGGCGGCAAG 
AGTCCGAATC TCGTGTTCGC CGACTGCAAG GACCTGGATC GCGTGGCCGA ACACGCTGCT 
GCCGCGATCT TCCACAATCA GGGCGAGGTG TGCATCGCCG GCTCGCGCCT GCTGGTCGAG 
AACAGCATTC GCGAGCGTTT CGTCGGCAAG GTGCTGGCCG CCGCCGAACG CATGCAGCCC 
GGCGACCCGT TGGATCCGGC GAGCTTCATG GGCGCGATGG TCGATCAGAC CCAGTATCAA 
CGCGTACTCG ACTACATCCG CCAGGGTGTC GAAGAAGGCG CGACGCTACG TGCCGGCGGC 
CAGGCGCTGG ATATCGAGGG GGCCAAGGGC CTGTTCATCG GGCCGACGGT ATTCGATGGC 
GTCACCGACA CCATGGCCAT CGGTCGGGAG GAAATATTCG GCCCGGTATT GGCGGTGTTC 
GGCTTCGACA CCGAGGAGGA GGCCGTACGT CTGGCCAACG ACAGCGACTA CGGCCTGGCG 
GCGGGCCTGT GGAGTCAGGA CATCGATCGC ATCATGCGCG TCACCCGTCG GCTGCGCTCG 
GGCCAGGTCT TCGTCAACAA CTGGGCCGAT ATGGATCAGA CGGTGCCCTT CGGCGGGGTC 
AAGCAGTCCG GCAACGGTCG CGACAAGTCC CACCATTCGC TGGAGGAATA CTCCGATCTC 
AAGACCGTCT GGATGACGCT CGCCACCTGA

Protein sequence

MTHSTPSNPV THADWQALAE HLTVEAGLEA RAYIDDTFVD AADGATFTTL NPATGETLAE 
VASCDAADAE TAVSVARRAF ESGAWSRSSP GERKAVLLRL ADLMEAHKHE LALLDSLDMG 
KPVSSAMGDM AGAIGCIRHH AESIDKLYGE IAPTGEESLG LVLREPLGVV ASIVPWNFPL 
MMTAWKIGPA LAAGNSVILK PSEKSPLSAL RLAQLTREAG LPRGVFQVLP GFGHTVGKAL 
ALSMGVDCLA FTGSTGVGKQ LMQYAGQSNL KKVFLECGGK SPNLVFADCK DLDRVAEHAA 
AAIFHNQGEV CIAGSRLLVE NSIRERFVGK VLAAAERMQP GDPLDPASFM GAMVDQTQYQ 
RVLDYIRQGV EEGATLRAGG QALDIEGAKG LFIGPTVFDG VTDTMAIGRE EIFGPVLAVF 
GFDTEEEAVR LANDSDYGLA AGLWSQDIDR IMRVTRRLRS GQVFVNNWAD MDQTVPFGGV 
KQSGNGRDKS HHSLEEYSDL KTVWMTLAT