Gene BCZK1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK1149
Symbol
ID	3024079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	1251054
End bp	1253003
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	40%
IMG OID	637545381
Product	hypothetical protein
Protein accession	YP_082748
Protein GI	52144080
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00702] uncharacterized domain [TIGR03604] bacteriocin biosynthesis docking scaffold, SagD family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAA ATATATTACT TATAGGAGAT GGCATTCTTG CAGACTATGT ACATGATCAA 
TTATACAAAC AATATTCCAT CATTCGCCAA CATACAATTG CAGACGAACT CCCTGAAAAT 
ATCGACCTCG CTCTCGTATT ACACGACGGC TCTCCTTCTA CTATTCACCA TGACGCTGAG 
CTAACTTTCC GGTCAAATCA TATTCCGTGG CTACGTGGTT TTACTTCATT TGGTGAAGGG 
ATTATCGGGC CTTATATTCA CCCTCCTGCA GCGGGATGTA CTCATTGTGC CGATGGACGA 
CGCTTTATCG CTGGATTTGA TCAAAAAGAA ATGTGGGAGT TACAACGAAA ATATGCGGTA 
AAAGAAGAAA ACGTAACGAG GCGTGATGTA CGTGCCACCC AAAATGGCAT TCTGCAAATG 
TGCCATTTGA TTTGCGCAGA AACAGAGAAA ATATTAACTC ATAATCACCC TTCTTTAGAA 
AATGAACTCA TTTTACTAAA CTTACAAACA CTGCAATGTA CGCGGCATTC TTTTCTTCCA 
GATCCAATCT GCCCTGTATG TAGTAATTTA CCTGATGACA CGGCAGATGC AGCAGCAATT 
TCATTACAAC CGAGCTTAAA AACAAGTGAT GCAACATATC GCTGTCGTTC CATTCATGAA 
CTAAACACAT TTTTAACGAA AGACTATTTA GATTACCGAG TCGGTATGTT GAATGGAAAA 
ATGCAGCATT CTTTATTACC ATTTGCTGAC GTTATTATAA ACATGCCATT ACTGTTTGGA 
AATGAAGGGG TTGCAGGGCG CACTCATTCA TTTGCAATCA GTGAAGCAAC TGCTATTTTA 
GAAGGTTTAG AACGATATTG TGGTATGTCA CCTCGAGGGA AAAAGACAAA TGTGTATGGT 
AGTTTTCATG ATGTAGAGGA CCACGCGCTG AATCCCCTTA CGCTCGGTGT ACATACAAAT 
GAACATTATA ATCGTGATGG TTTTCCATTT AAACCATTTG ATCCTGACTA TGAACAAAAC 
TGGGTATGGG GATATTCACT ATCACAAAAC CGGCCAATTT TAGTTCCTGA ATCAATCGCT 
TATTATAGCC TCGGTCATCG AGATGCTTAC GTATATGAAA CATCAAATGG ATGTGCCATT 
GGTGGTAGTT TAGAAGAAGC AATTTTTCAC GGCATTTTAG AAATTGTAGA GCGTGACGCC 
TTTTTGCTCA CTTGGTATGC TGAATTACCT CTTCACCGCC TTGATCTTAG TTCAGCACAT 
GATACAGAAT TACAATTAAT GATTCAGCGG CTATACACGA TTACTGGTTA TGAATTACAT 
GCATTTAACG CAACGATGGA ACACGGCATC CCGAGCTTAT GGGTAATTGC GAAAAATACG 
CGTGAAAATG GAATGAATGT CGTTTGTGCT GGAGGCTCTC ATTTGGACCC AGTCCGTGCT 
TTAAAGAGTG CCATTCACGA AATAGCAGGC ATGTTACTTA TAACAGACGA TGAACTTGAG 
GAAAAAAGAG AGTACTATGA AAACTGCTTA CAAGACCCGT ATCTCGTAAA TAAAATGGAA 
GACCATAGTA TGCTGTACGG ATTGAAAGAA GCAGAAGAAC GTCTTCACTT TCTTTTACGC 
GGGGATGCCC CGGTGCAAAC GTTCCAGGAA ATGAATGCAT TACAATCAGT TGATCTAGAT 
TTAACATCCG ATCTTCATCA ACTTTTAAAC CGTCTAGGGC AATCTGGACT TGAAGTAATC 
GTTGTCGATC AAACAGTACC TCTTATAGAA AAAAACGGAT TACATTGTGT AAAAGTCATT 
ATTCCAGGCA TGCTACCGAT GACATTTGGT CACCATCTCA CTCGACTTAC AGGGCTAGAT 
CGAGTGTATA CCGTACCGAT GACACTTGGA TATACAGACG AACCTTTAAC GAATGAACAA 
TTAAATCCAC ATCCGCACCC GTTTCCATAG

Protein sequence

MTQNILLIGD GILADYVHDQ LYKQYSIIRQ HTIADELPEN IDLALVLHDG SPSTIHHDAE 
LTFRSNHIPW LRGFTSFGEG IIGPYIHPPA AGCTHCADGR RFIAGFDQKE MWELQRKYAV 
KEENVTRRDV RATQNGILQM CHLICAETEK ILTHNHPSLE NELILLNLQT LQCTRHSFLP 
DPICPVCSNL PDDTADAAAI SLQPSLKTSD ATYRCRSIHE LNTFLTKDYL DYRVGMLNGK 
MQHSLLPFAD VIINMPLLFG NEGVAGRTHS FAISEATAIL EGLERYCGMS PRGKKTNVYG 
SFHDVEDHAL NPLTLGVHTN EHYNRDGFPF KPFDPDYEQN WVWGYSLSQN RPILVPESIA 
YYSLGHRDAY VYETSNGCAI GGSLEEAIFH GILEIVERDA FLLTWYAELP LHRLDLSSAH 
DTELQLMIQR LYTITGYELH AFNATMEHGI PSLWVIAKNT RENGMNVVCA GGSHLDPVRA 
LKSAIHEIAG MLLITDDELE EKREYYENCL QDPYLVNKME DHSMLYGLKE AEERLHFLLR 
GDAPVQTFQE MNALQSVDLD LTSDLHQLLN RLGQSGLEVI VVDQTVPLIE KNGLHCVKVI 
IPGMLPMTFG HHLTRLTGLD RVYTVPMTLG YTDEPLTNEQ LNPHPHPFP