Gene CPF_1586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1586
Symbol
ID	4202382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1803526
End bp	1804773
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	27%
IMG OID	638082464
Product	HK97 family phage portal protein
Protein accession	YP_696029
Protein GI	110799190
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00170734
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTT TTAAAAAGTT ATTTAATAAA AGAAGTAATT ATGATGAAGA GATTGGTATT 
AATATATCTG ATTCTAACTT TTGGGAGAAG TTTGGTATTA AATTAAAATT TTTAATATCA 
GGTAAGAGAG TATTAAAAGA AAATACAGTT TATATATGTA CTAAGGTAAG AGCTGAAAGC 
ATAGGTAAAT TATCTTTAAA GATTTACAAG GATAGAGAAG AGTATAAAGA ACATGAACTT 
TATTATCTTT TAAGATATAA GCCTAATCCA TTAATGAACT CAATTAATTT TTGGAAGTGC 
TTAGAAGCAC AAAGAACTTT AAAAGGTAAT GCGTATACAT ATATAGAAAG AGATAGAAGA 
GGAAAGATAA TTGGTTTATA TCCTATTGAT TCAGATAATG TAACTAAAGT TATGGATGAT 
AATAACTTTT TAAGTAGTTT AACTAAAGTT TGGTATATAG TAACTGACAA TAAAGGGATT 
AAACATAAGT TACTTCCTGA TGAAATACTA CATTTTATTG GAGATATTAC TTTAGATGGA 
TTAATAGGAA TAGCTCCACT TGATTATTTG AAATGTACTA TTGAGAATGG AAGAGCTACT 
CAGGAGTTTA TAAATAAATT CTTTAAAAGT GGATTAACTA CAAAAGGAAT AATTCAATAT 
GTAGGAGAGC TAGACGAAAA GGCAAAGAAA ACTTTTATAA AAGAATTTGA ATCTATGAGT 
AATGGTCTAG CAAATGCTCA TTCGGTTTCA TTACTTCCTT TAGGGTATCA ATTTCAACCT 
TTGTCATTAA GCATGGCAGA TGCACAATTT TTAGAAAATG CAAAATTAAC TAAAAGAGAA 
TTAGCAGCAG CATTTGGAAT GAAGTCATAT CATCTTAATG ATTTAGAGAG AGCAACATTT 
AATAATCTTA CAGAACAACA GAAAGATTTT TATATAACAA CACTTCAACC ATCTCTTACT 
AATTATGAAC AAGAGATGCA AGATAAATTA TTAAGTCAAT ATGAAACTTT AAATAATGTG 
AAAATTGAGT TTAATGTAGA TAGTATTTTA AGAAGTGATA TAAAAACAAG ATATGAAGCT 
TATAGAATTG GTATTCAAAG TGGATTTATA GCTTCCAATG AGGTGAGAAA AAAAGAAAAT 
TTACCACCAA AAGATGGAGG AAATGAATTA CTTATAAATG GTAATATGAT GCCTATAGCT 
ATGGCTGGAA AACAATATTT GAAAGGTGGT GATAATAGTG GAGCATAA

Protein sequence

MKFFKKLFNK RSNYDEEIGI NISDSNFWEK FGIKLKFLIS GKRVLKENTV YICTKVRAES 
IGKLSLKIYK DREEYKEHEL YYLLRYKPNP LMNSINFWKC LEAQRTLKGN AYTYIERDRR 
GKIIGLYPID SDNVTKVMDD NNFLSSLTKV WYIVTDNKGI KHKLLPDEIL HFIGDITLDG 
LIGIAPLDYL KCTIENGRAT QEFINKFFKS GLTTKGIIQY VGELDEKAKK TFIKEFESMS 
NGLANAHSVS LLPLGYQFQP LSLSMADAQF LENAKLTKRE LAAAFGMKSY HLNDLERATF 
NNLTEQQKDF YITTLQPSLT NYEQEMQDKL LSQYETLNNV KIEFNVDSIL RSDIKTRYEA 
YRIGIQSGFI ASNEVRKKEN LPPKDGGNEL LINGNMMPIA MAGKQYLKGG DNSGA