Gene BCG9842_B5531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B5531
Symbol
ID	7183229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	5170739
End bp	5171977
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	46%
IMG OID	643553194
Product	NADH dehydrogenase subunit C
Protein accession	YP_002448835
Protein GI	218900424
COG category	[C] Energy production and conversion
COG ID	[COG0852] NADH:ubiquinone oxidoreductase 27 kD subunit
TIGRFAM ID	[TIGR01961] NADH (or F420H2) dehydrogenase, subunit C

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.000346603
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTAATC CAAACAAAGA CTTAGAGGAT CTGAAAAAAG AAGCAGCTAG GCGTGCAAAA 
GAAGAAGCGA GAAAACGCCT TGTAGCGAAA CAAGAGGCGG AAATAAGTGA GCTGGAGGCA 
GAAAATCAAG AAAAAGAGAA AGCGCTACCA AAAAATAATG ATATTACTAT AGAAGAAGCA 
AAACGACGTG CAGAAGCGGC GGTGTTAGCG AAGCAGAAAA GAGAAGGAAC AGAAGAGGTA 
ACGGAAGAAG AAAAAGCGAA AGCAAAGGCA GCAGCAGCGG CAGCAAAAGC AAAAGCGGCG 
GCGTTAGCGA AGCAGAAAAG AGAAGGAACA GAAGAAGTAA CGGAAGAAGA AAAAGCAAAG 
GCAAAGGCAG CGGTAGCAGC AAAAGCAAAA GCGGCGGCGT TAGCGAAGCA GAAAAGAGAA 
GGAACAGAAG AGGTAACGGA AGAAGAAAAA GCGAAAGCAA AGGCAAAGGC AGCGGCAGCA 
GCAAAAGCAA AAGCGGCGGC GTTAGCGAAG CAGAAAAGAG AAGGAACAGA AGAAGTAACG 
GAAGAAGAAA AAGCGAAAGC AAAGGCAAAG GCGGTGGCAG CAGCCAAGGC AAAAGCGGCA 
GCATTAGCGA AGCAGAAAGC TTCGCAAGGT GATGGGGATT CGGGAGATGA AAAGGCAAAG 
GCAATTGCAG CAGCAAAAGC GAAAGCAGCA GCGGCTGCAA GAGCGAAGAC AAAGGGAGCT 
GAAGGTAAGA AAGAGGATGA GCCGAAGCGG GAAGAAACGT CCGTAAATCA GCCGTATTTA 
AATCAGTATG TTGAGGCTAT TAGGGAGAAG GTAGGAGAGG GTGCATTAGT AGATTCCTAC 
ATTAATAAAC TGTCAAAGGA TGTGCCGACT CTTGTGGTGG ATCCCGAAAA ATATTATGAA 
GTGATGGAGT CACTGCGATT CCATGAAGGA CTTGCTTTTG ATTACATGTC AGAGCTACAT 
GCGACGGATT TTGTGACACA TATGGAAGTA TATGTTCATT TGTTTTCATA TGGTAAGAAA 
CAATCGGTAG CGGTGAAGGT AAAGCTAGAC CGGGAAGAAC CGCAAGTTGA ATCTGTGACA 
GCGCTTTGGA AAGGGGCTGA CTGGCCGGAG CGAGAAGCAT ACGATTTGCT CGGCATTGTA 
TTTAAAGGGC ATCCGAATTT AACGCGTATT TTAATGCCAG ATGATTGGGT AGGACATCCG 
CTTAGAAAAG ACTATGAACC GTATGATGTG GAGGTGTAG

Protein sequence

MSNPNKDLED LKKEAARRAK EEARKRLVAK QEAEISELEA ENQEKEKALP KNNDITIEEA 
KRRAEAAVLA KQKREGTEEV TEEEKAKAKA AAAAAKAKAA ALAKQKREGT EEVTEEEKAK 
AKAAVAAKAK AAALAKQKRE GTEEVTEEEK AKAKAKAAAA AKAKAAALAK QKREGTEEVT 
EEEKAKAKAK AVAAAKAKAA ALAKQKASQG DGDSGDEKAK AIAAAKAKAA AAARAKTKGA 
EGKKEDEPKR EETSVNQPYL NQYVEAIREK VGEGALVDSY INKLSKDVPT LVVDPEKYYE 
VMESLRFHEG LAFDYMSELH ATDFVTHMEV YVHLFSYGKK QSVAVKVKLD REEPQVESVT 
ALWKGADWPE REAYDLLGIV FKGHPNLTRI LMPDDWVGHP LRKDYEPYDV EV