Gene BCG9842_B0558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B0558
Symbol
ID	7183374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	4502354
End bp	4503439
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	41%
IMG OID	643552468
Product	peptidase, M42 family
Protein accession	YP_002448135
Protein GI	218899724
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000121832
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	5.5021500000000004e-18
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAAAAT TAGACGCGAC ATTGACAATG CTAAAAGAAT TAACAGATGC ACGTGGTATT 
GCCGGTAACG AGCGTGAACC ACGCGAAGTA ATGAAGAAAT ATATCGAGCC ATTTGCAGAC 
GAGCTTTCTA CTGATAATTT AGGAAGTTTA GTTGCGAAAA AAGTAGGGGA AGAAAACGGC 
CCGAAAATTA TGGTTGCAGG TCATTTAGAT GAAGTTGGCT TTATGATTAC GCAAATTGAT 
GACAAAGGTT TCCTACGCTT CCAAACGGTG GGTGGCTGGT GGTCACAAGT TATGCTTGCA 
CAGCGCGTGA CGATTGTAAC GCGTAAAGGA GATGTAACAG GTGTAATTGG TTCAAAACCA 
CCGCACATCT TACCTCCAGA AGCACGTAAA AAGCCAGTTG AAATTAAAGA CATGTTCATC 
GATATCGGTG CTTCTAGCCA AGAAGAAGCA ATGGAGTGGG GCGTACGACC AGGAGATCAA 
GTTGTACCTT ACTTTGAATT CCAAGTGATG AAGAATGAAA AAATGTTACT TGCAAAAGCA 
TGGGATAACC GAATCGGTTG TGCGATTGCA ATTGACGTAT TAAAACAATT AAAAGATGAA 
AAGCATCCAA ACGTTGTATA CGGCGTTGGA ACTGTACAAG AAGAAGTTGG TCTTCGTGGT 
GCAAAAACAT CTGCGAATTA TATTAAACCA GATATCGCGT TCGCAGTAGA TGTTGGTATC 
GCTGGAGATA CACCGGGTGT AACGTCAAAA GAAGCGCAAA GTAAAATGGG CGATGGACCA 
CAAATCATTT TGTATGATGC TTCTGTTATT GGACATACAG GTTTACGTGA TTTCGTAGTT 
GATGTTGCTG ACGAATTACA AATCCCATAC CAATATGATT CAGTAGCGGG CGGGGGAACT 
GATGCGGGTG CGATTCATAT TGCTGTAAAC GGTATTCCTT CTATGGCAAT TACAATTGCA 
ACGCGCTATA TTCATTCTCA TGCAGCAATG TTACACCGTG ATGATTATGA AAATGCAGTA 
AAGTTAATTG TAGAAGTTAT TAAACGTCTT GATAAGGATG CTGTACATAA CATTACATTT 
AATTAA

Protein sequence

MTKLDATLTM LKELTDARGI AGNEREPREV MKKYIEPFAD ELSTDNLGSL VAKKVGEENG 
PKIMVAGHLD EVGFMITQID DKGFLRFQTV GGWWSQVMLA QRVTIVTRKG DVTGVIGSKP 
PHILPPEARK KPVEIKDMFI DIGASSQEEA MEWGVRPGDQ VVPYFEFQVM KNEKMLLAKA 
WDNRIGCAIA IDVLKQLKDE KHPNVVYGVG TVQEEVGLRG AKTSANYIKP DIAFAVDVGI 
AGDTPGVTSK EAQSKMGDGP QIILYDASVI GHTGLRDFVV DVADELQIPY QYDSVAGGGT 
DAGAIHIAVN GIPSMAITIA TRYIHSHAAM LHRDDYENAV KLIVEVIKRL DKDAVHNITF 
N