Gene BCZK0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK0472
Symbol
ID	3026514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	+
Start bp	554148
End bp	555278
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	35%
IMG OID	637544689
Product	IS605 family transposase
Protein accession	YP_082079
Protein GI	52144749
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATTGG CGAAGAAAGT TAGACTGATT CCAACGCCTG AACAAGAAAA GGTGCTTAGA 
AACCATGCTG GTGCTGCAAG ATTCGCTTAT AACTATTGTA AAAGAATGAG TGATAGATAC 
TATAAGCTAT TTGGAAAATC TGTTTCCCAG TTAGCTTTAC AGAAACGATT TACAAAGATC 
AAGAAGCGAA AGAGATATGA GTGGTTAAAA TACATTAATG CACAAGTTCC CAAACAGGCT 
TCAAAAGATT TTGATACGGC GAGAAAACAT TCGTTCAAAA AGTACAAAAA TGGTTATCAC 
ACTTCTTATA AATCCAAAAA AGATGTAATC CAAGGATTTT ATGCCAATTA TGAAAGACTG 
GTTATAGGAA AGAAAGTCGT TCATATTCAG TCTATTGGAG AAGTGAAAAC AAGCCAACAA 
CTACCAAGAA ATAAAAAACC ATCCAATCCA AGAGTTACCT TTGATGGTCG TCACTGGTGG 
ATTAGTGTAG GGTTCCAAGA AGACTTTGAA TCACAAGAAC TAACGAATGA GTCGATTGGT 
GTGGATGTTG GTTTAAAAGA ACTTTTTGTA GCTTCTAATG GTATGAAAGA ACGAAATATA 
AACAAAGATG CCAAAGTTAA AAAACTTTTG AAAAGGAAAA AGTCAGCACA AAGAGATATG 
TCTAGGAGAT TTAAAAAAGG TGTAACAATT CAATCTGCCG GATATGAAAA AGCTAGAGCG 
GAGCACCTGC GGTTATCTAG GAAAATTACG AATATCCGAA ATAACCATAT CCATCAAGCA 
ACAGCAAAAT TGGTGAAAAC CAAACCAATG AGGATTGTTG TGGAAGACTT ACCTATCTCA 
AACCTGTTAA AAAACAAAAA ACTATCGAAA GCATTCTTAT TTCAAAAATT AAACTTCTTC 
TTTCAATGTT TATCATACAA GTGCGAGAAA TATGGCATTG CGTATGTAAA AGCTGATAAA 
TGGTTCGCCT CAAGCAAGAT TTGTTCATGT TGCGGAGTAA AATACGACCA TTCAGTTCAA 
CCAGAAGGAC AATGGAGTTT AAAAATACGT GAGTGGTGTT GTGCTTCATG CAATAGCCAT 
CACGATCGAG ATGTAAATGC TGCGATGAAT TTATCAAGAT GGGTAAAATA A

Protein sequence

MILAKKVRLI PTPEQEKVLR NHAGAARFAY NYCKRMSDRY YKLFGKSVSQ LALQKRFTKI 
KKRKRYEWLK YINAQVPKQA SKDFDTARKH SFKKYKNGYH TSYKSKKDVI QGFYANYERL 
VIGKKVVHIQ SIGEVKTSQQ LPRNKKPSNP RVTFDGRHWW ISVGFQEDFE SQELTNESIG 
VDVGLKELFV ASNGMKERNI NKDAKVKKLL KRKKSAQRDM SRRFKKGVTI QSAGYEKARA 
EHLRLSRKIT NIRNNHIHQA TAKLVKTKPM RIVVEDLPIS NLLKNKKLSK AFLFQKLNFF 
FQCLSYKCEK YGIAYVKADK WFASSKICSC CGVKYDHSVQ PEGQWSLKIR EWCCASCNSH 
HDRDVNAAMN LSRWVK