Gene CPF_0871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0871
Symbol
ID	4201770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1034911
End bp	1036083
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	26%
IMG OID	638081754
Product	IS605 family transposase OrfB
Protein accession	YP_695321
Protein GI	110800784
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000854897
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGT TGAAAAAGGC ATACAAGATG GAGATTAATC CTACTGATAA GCAAAAATCT 
AAAATACACC GAACTATTGG TGTATCAAGA TTTATATATA ATTTCTACAT TGCTCGTAAT 
AAAGAAATTT ACGAGAGAGA AGGAAAGTTT GTTAGTGGAA TGGATTTTTC AAAGTGGTTA 
AATAATGAAT ATATTCCTAA TAATCAAGAA ATGAAGTGGA TTAAAGAAGT ATCTTCAAAA 
GCTACTAAAC AAGCTATTAT GAATGGAGAT AAATCTTTTA GAGATTTCTT TAAAAAAGCT 
AAAGGCTTTC CAAAATTTAA AAAAAAGAAA AATCAAGATG TAAAAGCTTA TTTTCCTAAG 
AATAATAAGA CTGATTGGAC TATTGAAAGG CATAGAGTCA AAATACCAAC TTTAGGATGG 
ATAAGATTAA AAGAATTTGG TTATATTCCT GTAAATTCAA TAGTCAAAAG TGGTACAGTA 
AGTCAAAAAG CTGATAGATA TTATGTATCT ATATTGGTTG AAGAAACAGA TATAAAAATA 
TCTAATCCCA ATAATGCAGG CGTAGGAATT GATCTAGGTA TTAAGGAATT TGCTGTATGT 
AGTGATGGAA TTAAGTTTAA AAATATAAAT AAAACATCTA CTGTTAAAAA AGTAGAAAAG 
AAATTAAAAA GAGAGCAAAG AAAACTTTCA AGAAAATATG AAAGTTTAAA AATAAGAAAT 
AAAAATATAA AAGAAGGGAG AGCTACTCGT CAAAATATTC AAAAACAAAT AATCAAAGTA 
CAAAAACTTC ATCAGAGATT AACAAATATA CGAACTGATT ATATAAATAA AATAGTATCT 
TCAATTATAA AGCAAAAACC AAGCTATATA ACAATTGAAG ATTTAAATGT TAAAGGAATG 
ATGAAGAATA AGCATTTATC TAAAGCTATT GCAAGTCAGA AGTTCTTTGA ATTTAAAACT 
AAGTTAACAG TTAAATGCAA AGAAAATCAT ATAGAACTTA GAATAGTGGA TAGATTTTAT 
CCATCATCAA AGACTTGTAG TCAATGTGGA AAGGTTAAGA AAGATTTAAA ACTATCAGAT 
AGAATTTATA AATGCGATTG CGGATTTACT ATTGATAGAG ATTTAAACGC AAGTATTAAT 
CTTAAAAATG CTAAAGAATA TAAGATAGCT TAA

Protein sequence

MKKLKKAYKM EINPTDKQKS KIHRTIGVSR FIYNFYIARN KEIYEREGKF VSGMDFSKWL 
NNEYIPNNQE MKWIKEVSSK ATKQAIMNGD KSFRDFFKKA KGFPKFKKKK NQDVKAYFPK 
NNKTDWTIER HRVKIPTLGW IRLKEFGYIP VNSIVKSGTV SQKADRYYVS ILVEETDIKI 
SNPNNAGVGI DLGIKEFAVC SDGIKFKNIN KTSTVKKVEK KLKREQRKLS RKYESLKIRN 
KNIKEGRATR QNIQKQIIKV QKLHQRLTNI RTDYINKIVS SIIKQKPSYI TIEDLNVKGM 
MKNKHLSKAI ASQKFFEFKT KLTVKCKENH IELRIVDRFY PSSKTCSQCG KVKKDLKLSD 
RIYKCDCGFT IDRDLNASIN LKNAKEYKIA