Gene BCAH820_4686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCAH820_4686
Symbol
ID	7191194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus AH820
Kingdom	Bacteria
Replicon accession	NC_011773
Strand	-
Start bp	4439626
End bp	4440711
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	41%
IMG OID	643558096
Product	peptidase, M42 family
Protein accession	YP_002453632
Protein GI	218905798
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	6.124679999999999e-51
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAAAAT TAGACGAGAC ATTGACAATG CTAAAAGAAT TAACAGATGC ACGCGGTATT 
GCGGGTAACG AGCGTGAACC ACGTGAAGTA ATGAAGAAAT ATATTGAGCC GTTTGCGGAC 
GAACTTTCTA CTGATAATTT AGGAAGTTTA GTTGCGAAAA AAGTAGGGGA AGAAAACGGC 
CCGAAAATTA TGGTTGCAGG TCATTTAGAT GAAGTTGGCT TTATGATCAC GCAAATTGAT 
GACAAAGGTT TCCTTCGTTT CCAAACAGTT GGTGGCTGGT GGTCACAAGT TATGCTTGCG 
CAGCGCGTGA CAATTGTAAC GCGTAAAGGA GATGTAACAG GTGTAATCGG TTCAAAACCA 
CCGCATATCT TACCTCCAGA AGCGCGTAAA AAGCCAGTTG AAATTAAAGA CATGTTCATC 
GATATTGGTG CTTCTAGCCA AGAAGAAGCA ATGGAGTGGG GCGTACGACC AGGAGATCAA 
GTTGTACCTT ACTTTGAATT CCAAGTGATG AAGAATGAAA AAATGTTACT TGCAAAAGCA 
TGGGATAACC GAATTGGTTG TGCAATTGCA ATTGACGTAT TAAAACAATT AAAAGATGAA 
AAGCATCCAA ACGTTGTATA CGGCGTAGGG ACTGTACAAG AAGAAGTCGG TCTTCGTGGT 
GCGAAAACAT CTGCAAACTA TATTAAACCA GATATCGCAT TCGCAGTAGA TGTTGGTATC 
GCTGGTGACA CACCGGGGGT AACGTCAAAA GAAGCGCAAA GTAAAATGGG TGATGGACCA 
CAGATCATTT TATATGATGC TTCTGTTATC GGTCATACCG GTTTACGTGA CTTTGTAGTT 
GATGTTGCTG ATGAATTACA AATTCCGTAT CAATATGATT CAGTAGCGGG CGGTGGAACG 
GATGCAGGTG CAATTCATAT TGCTGTAAAT GGTATTCCGT CTATGGCAAT TACCATTGCA 
ACGCGTTACA TTCATTCTCA TGCGGCAATG TTACACCGTG ATGACTATGA AAACGCAGTG 
AAGTTAATTG TAGAAGTTAT TAAACGTCTT GATAAAGAGG CTGTACATAA CATTACATTT 
AATTAA

Protein sequence

MTKLDETLTM LKELTDARGI AGNEREPREV MKKYIEPFAD ELSTDNLGSL VAKKVGEENG 
PKIMVAGHLD EVGFMITQID DKGFLRFQTV GGWWSQVMLA QRVTIVTRKG DVTGVIGSKP 
PHILPPEARK KPVEIKDMFI DIGASSQEEA MEWGVRPGDQ VVPYFEFQVM KNEKMLLAKA 
WDNRIGCAIA IDVLKQLKDE KHPNVVYGVG TVQEEVGLRG AKTSANYIKP DIAFAVDVGI 
AGDTPGVTSK EAQSKMGDGP QIILYDASVI GHTGLRDFVV DVADELQIPY QYDSVAGGGT 
DAGAIHIAVN GIPSMAITIA TRYIHSHAAM LHRDDYENAV KLIVEVIKRL DKEAVHNITF 
N