Gene BCZK1401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK1401
Symbol
ID	3023224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	+
Start bp	1490505
End bp	1491767
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	35%
IMG OID	637545633
Product	TPR repeat-containing protein
Protein accession	YP_082999
Protein GI	52143829
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0553383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGT TTGAACAAGC TGTTTCATAT ATTGAAAATG GTGAAGCGGA AAAAGGATTA 
CAATTATTAA AAGAGCAATT AAAAATTGCG AATGATGAAG AGAAGTATGA TATTGCTCGC 
TATTATCATA CTCTTGGATT TACGGATGAA GCGTTAGCTA TTACAGAAGA TTTGCGTTTA 
TTGTATCCAG AAGAAAGTGA ATTCACTGTA TTTTTAGCAG AATTATATAT TGATCTAGAC 
AAAGAAGATG AAGCGATTGA AGTGCTTCAT GATATTCCAG AAAATGATGA TTTATATGTT 
CAATCGTTAT TACTAGTTGC GGATTTATTC CAAATGCAAG GTTTTGATGA TGTAGCAGAA 
CAAAAACTAT TAAAGGCGAA AGAAATGATG CCTGACGAAC CTGTCATTAC GTTTGGATTA 
GCAGAGTTAT ATAGTAGTAA AGGTGAAGAA CAAAAGGCAA TCACTTATTA TGAGTCGCTA 
TTAGCGGAAC ATAAAGTAAT GGGTGGTGTT GTCATTGCAC TACGCCTTGG AGAAACGTTA 
AGTGCGATTG GAAATTGGGA AGAGGCGATT TCTTACTACG AAGCAGGTTT AGAAGAACAA 
AAAGATATCC ACTCATTGTT TGGATATGCC TTCACATTAT ACCAAGGTGA AGAATACCAA 
AGAGCAATTG GTGCTTGGCA AGAACTAAAA GAATTAGATC CTGAGTATGC ATCCCTTTAC 
ATGTATTTAG CGAAAAGCTA TGAAAAAGAA GGAATGCTTC AAGAAAGCTA TGAAACACTT 
CATGAAGGAA TTAAAGTAGA TGAACTTTCT GTACCATTTT ATGTAGAATT AGCGAACATT 
GCAGCGAAAT TAGGGAAAAT AGCGGAAGCA GAGGAAGTGC TTCAAAAAGC GCTTGAGTTA 
GATCCAGGAC ATTTAGGTGC AACATTAAAA TATGCATATA TCTTAAAGGA ACAAGAAAAG 
TATGAAGAGC TAATTGCCGT TGTAGAGCGT GCTATCGATA GTGGAGAACC AGATACACAA 
CTACTTTGGG ATCTTGCGTT TGCAAAAAAA CAATTAGAAA TGTATTCTGA TGCATTAAAA 
CACTATGAAA GTGCATATAC TTCTTTTAAG AATCATCCAG ACTTCTTGGA AGAGTACGGT 
TATTTCTTAT TGGAAGAAGG TATGCGAAAA GAGGCGAAAG AAGTATTTAC TCAGTTAATA 
CAACTAGACC CGACACAAAT TCATATTGAA GAATTGTTAT ATAATTTAGA GGATTTTTCA 
TAA

Protein sequence

MQKFEQAVSY IENGEAEKGL QLLKEQLKIA NDEEKYDIAR YYHTLGFTDE ALAITEDLRL 
LYPEESEFTV FLAELYIDLD KEDEAIEVLH DIPENDDLYV QSLLLVADLF QMQGFDDVAE 
QKLLKAKEMM PDEPVITFGL AELYSSKGEE QKAITYYESL LAEHKVMGGV VIALRLGETL 
SAIGNWEEAI SYYEAGLEEQ KDIHSLFGYA FTLYQGEEYQ RAIGAWQELK ELDPEYASLY 
MYLAKSYEKE GMLQESYETL HEGIKVDELS VPFYVELANI AAKLGKIAEA EEVLQKALEL 
DPGHLGATLK YAYILKEQEK YEELIAVVER AIDSGEPDTQ LLWDLAFAKK QLEMYSDALK 
HYESAYTSFK NHPDFLEEYG YFLLEEGMRK EAKEVFTQLI QLDPTQIHIE ELLYNLEDFS