Gene BCG9842_B4008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B4008
Symbol
ID	7181502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	1237812
End bp	1239179
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	38%
IMG OID	643549057
Product	aldehyde dehydrogenase (NAD) family protein
Protein accession	YP_002444727
Protein GI	218896316
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.148119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00000000000192548
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTATTT CCTCTATTGT AAGTAGGCAA AAGGAATATT TTTTAAAAGG GCATACGAGA 
AGCATCGAAA TGAGAAAGAA TAATTTGAAG AGGCTTTATG AAGGCATTCA GCGTTTTGAA 
GAAGAAATAT TTCAGGCATT GAAATTAGAT TTAAATAAGT CAGTTCACGA GTCGTTTACA 
ACGGAAGTTG GATATGTATT AAAAGAAATT TCTTTTCAAT TGAAACATAT GTCATCGTGG 
AGTAAACCAA AGCGAGTTCG AACAGCACTG ACTCATTTTG GATCAAAAGG AAAAGTAGTG 
CCAGAACCGT ATGGTGTTAC GCTTATTATT GCACCGTGGA ACTATCCGTT CCAATTAGCA 
ATTGCACCAC TTGTAGGAGC ACTGGCAGCT GGAAATACAA TCGTTTTAAA GCCGTCAGAG 
TTAACGCCAA GCGTTTCAAA AGTGCTTAAG AGAATGTTAG GTGAGTTATT CCCAGAAGAG 
CTTGTAGCGG TAGTAGAAGG TGGCGTTGAA GAGAGTACAT CTTTGCTGAG GGAACCGATT 
GATTATATTT TCTTTACTGG TAGTGTTGGC GTTGGAAAAG TTGTAATGGA AGCAGCAGCG 
AAACAGTTGA CGCCGCTTAC GTTAGAACTT GGCGGGAAAA GTCCTTGTAT TGTACATAAA 
GATGCAAAGA TAGAGATGAC AGCAAGAAGA ATTGTTTGGG GTAAGTTTTT AAATGCAGGG 
CAGACGTGTG TAGCGCCTGA TTATATGTAC GTGCATTCTT CCGTGAAAGA AAAGCTAATT 
GAGGCAATGC GACATGAAAT TACAGAGCAG TATAGTAAAG AACCTTTGCA AAATGAAAAT 
TACGTGCGTA TTGTAAGTGA GCGTCATTTT GAACGATTAT GTCGATTTTT ACAAGATGGT 
CAAGTCGTAA TTGGTGGAAA CTATAAGAAA GATACATTAC ATATTGAGCC GACAGTACTA 
GCGGATACTA CATGGCAAGA TGCTGTTATG GAAGATGAAA TTTTTGGCCC GATTTTACCA 
ATCATAGAGT ACGACAATAT AGAAGATGTA ATTGGCACAA TTCAGCAACA TCCGAAGCCG 
TTAGCGTTAT ATGTATTTTC TGAAGATAAA GAAGTACAAA AGAAAGTGAC GAGTAATATT 
TCATATGGTG GAGGCTGTAT TAATGATGTT GTCTATCATC TTGCCACGCC ATATTTACCT 
TTTGGGGGTG TTGGAAGTAG TGGATTAGGG GGTTATCATG GGAAAGAAAG TTTTCGGACT 
TTTTCACATT ATAAAAGCAT TTTAGCCCAA TCTACAGCAT TCGACATGAA AATTCGTTAC 
TCTTCTACAA AAAGTGCTTT AAAATTCATA CGAAAGTTGT TAAAATGA

Protein sequence

MSISSIVSRQ KEYFLKGHTR SIEMRKNNLK RLYEGIQRFE EEIFQALKLD LNKSVHESFT 
TEVGYVLKEI SFQLKHMSSW SKPKRVRTAL THFGSKGKVV PEPYGVTLII APWNYPFQLA 
IAPLVGALAA GNTIVLKPSE LTPSVSKVLK RMLGELFPEE LVAVVEGGVE ESTSLLREPI 
DYIFFTGSVG VGKVVMEAAA KQLTPLTLEL GGKSPCIVHK DAKIEMTARR IVWGKFLNAG 
QTCVAPDYMY VHSSVKEKLI EAMRHEITEQ YSKEPLQNEN YVRIVSERHF ERLCRFLQDG 
QVVIGGNYKK DTLHIEPTVL ADTTWQDAVM EDEIFGPILP IIEYDNIEDV IGTIQQHPKP 
LALYVFSEDK EVQKKVTSNI SYGGGCINDV VYHLATPYLP FGGVGSSGLG GYHGKESFRT 
FSHYKSILAQ STAFDMKIRY SSTKSALKFI RKLLK