Gene BCG9842_B1655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B1655
Symbol	dhaS
ID	7181556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	3491462
End bp	3492946
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	41%
IMG OID	643551386
Product	aldehyde dehydrogenase (NAD)
Protein accession	YP_002447056
Protein GI	218898645
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.0330388
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAC TAGCTGTAAA TCTTCATGAA AAGGTAGAAA ATTTTCTTCA AGGTACAAAA 
AAGTTATATG TGAATGGATC TTTCATTGAA AGCGCTTCCG GAAAAACATT TAAAACACCT 
AACCCAGCAA CTGGTGAAAC ACTTGCCGTC GTTTCTGAAG CTGGTCGTGA AGATATTCAT 
AAAGCTGTAG TCGCAGCTCG TATGGCTTTT GACGAAGGTC CTTGGTCTCG TATGAGCACT 
GCTGAGCGAA GCCGTCTCAT GTACAAGTTA GCTGATTTAA TGGAAGAACA TAAAGAAGAG 
CTTGCACAGC TCGAAACATT AGATAACGGA AAGCCAATCC GTGAAACAAT GGCAGCAGAC 
ATACCACTTG CAATTGAGCA TATGCGCTAT TACGCTGGCT GGGCTACGAA AATCGTTGGT 
CAAACAATTC CTGTTTCCGG TGATTACTTT AACTATACAC GCCATGAAGC TGTTGGTGTC 
GTTGGTCAAA TTATCCCTTG GAACTTCCCG CTTCTTATGG CAATGTGGAA AATGGGAGCA 
GCGCTTGCTA CAGGATGTAC AATCGTTTTA AAACCTGCAG AACAAACTCC ACTATCTGCT 
CTATACTTAG CTGAATTAAT TGAAGAAGCT GGATTCCCGA AAGGTGTTAT TAATATCGTA 
CCTGGATTCG GTGAATCAGC TGGACAAGCT CTCGTTAATC ATCCACTCGT TGATAAAATT 
GCATTTACCG GTTCTACTCC TGTCGGTAAA CAAATTATGC GACAAGCATC CGAATCATTA 
AAACGCGTTA CACTTGAGTT AGGCGGTAAA TCACCAAATA TCATCTTGCC AGATGCTGAT 
TTATCTCGCG CGATTCCTGG TGCACTTTCT GGTGTTATGT TTAACCAAGG ACAAGTATGC 
TCTGCTGGAT CACGCTTATT TGTTCCGAAG AAAATGTATG ATAATGTCAT GGCTGATCTC 
GTCCTTTATT CTAAAAAATT AAATCAAGGC GCTGGTCTAA GTCCAGAAAC TACAATCGGT 
CCTCTCGTTT CCGAAGAACA ACAAAAACGT GTAATGGGCT TCATTGAAAA AGGGATTGAA 
GAAGGCGCTG AAGTACTTTG CGGAGGAAAT AATCCATTCG ATCAAGGCTA CTTCGTTTCT 
CCTACAGTAT TCGCTGACGT AAATGACGAA ATGACGATCG CAAAAGAAGA AATTTTCGGT 
CCAGTTATTT CTGCAATACC GTTTAACGAT ATTGATGAAG TAATTGAACG TGCGAATAAA 
TCTCAATTTG GCTTAGCTGC TGGTGTATGG ACAGAAAATG TTAAAACTGC ACACTATGTT 
GCAAGTAAAG TACGTGCAGG TACAGTATGG GTAAACTGTT ATAACGTCTT TGATGCAGCA 
TCTCCATTTG GAGGATTTAA ACAATCTGGT CTCGGCCGTG AAATGGGATC TTACGCATTA 
AATAACTATA CAGAAGTGAA GAGCGTTTGG CTTAACTTAA ATTAA

Protein sequence

MSQLAVNLHE KVENFLQGTK KLYVNGSFIE SASGKTFKTP NPATGETLAV VSEAGREDIH 
KAVVAARMAF DEGPWSRMST AERSRLMYKL ADLMEEHKEE LAQLETLDNG KPIRETMAAD 
IPLAIEHMRY YAGWATKIVG QTIPVSGDYF NYTRHEAVGV VGQIIPWNFP LLMAMWKMGA 
ALATGCTIVL KPAEQTPLSA LYLAELIEEA GFPKGVINIV PGFGESAGQA LVNHPLVDKI 
AFTGSTPVGK QIMRQASESL KRVTLELGGK SPNIILPDAD LSRAIPGALS GVMFNQGQVC 
SAGSRLFVPK KMYDNVMADL VLYSKKLNQG AGLSPETTIG PLVSEEQQKR VMGFIEKGIE 
EGAEVLCGGN NPFDQGYFVS PTVFADVNDE MTIAKEEIFG PVISAIPFND IDEVIERANK 
SQFGLAAGVW TENVKTAHYV ASKVRAGTVW VNCYNVFDAA SPFGGFKQSG LGREMGSYAL 
NNYTEVKSVW LNLN