Gene CPF_1146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1146
Symbol
ID	4203849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1309503
End bp	1310750
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	30%
IMG OID	638082027
Product	hypothetical protein
Protein accession	YP_695592
Protein GI	110800007
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00151555
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCAT TTTTAGAAAA AAGCTCAAAA ATCCAAGACC ATTTCACAGA CTGGAGAAAT 
ATTTACGCAA AACCTTATAA TAAAAACGAA GTTGATCCTT ATACAAAAAC TAGAATAATT 
TTAATGAATG GAGCTGAATT TGAAGCAAAC TGGTTTTCTC ATCAATTCTC TAGAAACTGT 
AATAACAATG AACTTAGAAG AGAACTTGCC CTTGCTAGAA GATTAGATAA ACAACAACAA 
ATGCTAATTG GTTCATTAAG ACCTGCTAAT GAAAGTATTT TAGAGACTAC TATAAGCTAT 
GAACAACTAG CTGTAGATTT AACTGCTAGA CTTGCAAAGC GTGAACCTAA TGAACATGTT 
AAAAAAGCTT TAGATTTTGC ATTACTTGAA GATTTTGACC ATTTATATAG ATATTCAGAT 
TTATTATTTA TGGAAGAAGG AACAAAAGCA GAAAATCTAG TTGGACATTA TACAGAAATA 
ATGCCAGGTA GACCAACCAT ATCTGAACAT AGATGCCCCG CTGACAACAT AAGAAACTTT 
GTTGATTTTA AAACAGCAGA CCTTATTACT AAACTAGATA TATCAATAAT AACTGCGGCA 
GAACAACAAA CTATGAATTA TTACATGAAT ATAGCAGGTT TCTATACTAG TGATATTGGA 
AGAAATCTTT ATCAAGAAAT AGGCTTAATA GAAGAACAAC ACGTTTCTCA CTATGGAAGT 
CTTTTAGATC CTAACTGTAC ATGGCTTGAA AATCTACTTA TGCATAAATA CACTGAAGCA 
TATTTGTATT ATTCTTGTTA TAATTCTGAA GTTGATCCAT ATATTAAAGG ACTATGGGAA 
CAATGCTTCG TTCAGGAAGT TGCTCAATTA CATAAAGCTT GTGATCTTCT TAAAAAATAT 
GAAAATAAAG AATGGCAAGA AGTTATTCCA AATGGTGAAT TCCCAGAACT TCTAACACTT 
GGAGAAAATA TATCTTATGT TAGAGATATA TTAGATAATA CTGTTAATAA TACAACTATA 
AAAGATGATT ACGTTGATGT AAGTAAATTA GGTCCTGATT CATCGTTCCA TGAATTCCAA 
AATAAAGTTA ATAAAAATGT TGAAGATGTT CCAAGTCATA AGGTCATAGT TGATTTTATT 
TCAAAAAATA ATGAAGATTA TAGATTTGAA ACAAAAGAAA ATCCAATTGT TGCTTTAAGA 
GATAGAAAAT CTGATAATAC TTCTATTGGA AGAACATCTT TAAGTTAG

Protein sequence

MNPFLEKSSK IQDHFTDWRN IYAKPYNKNE VDPYTKTRII LMNGAEFEAN WFSHQFSRNC 
NNNELRRELA LARRLDKQQQ MLIGSLRPAN ESILETTISY EQLAVDLTAR LAKREPNEHV 
KKALDFALLE DFDHLYRYSD LLFMEEGTKA ENLVGHYTEI MPGRPTISEH RCPADNIRNF 
VDFKTADLIT KLDISIITAA EQQTMNYYMN IAGFYTSDIG RNLYQEIGLI EEQHVSHYGS 
LLDPNCTWLE NLLMHKYTEA YLYYSCYNSE VDPYIKGLWE QCFVQEVAQL HKACDLLKKY 
ENKEWQEVIP NGEFPELLTL GENISYVRDI LDNTVNNTTI KDDYVDVSKL GPDSSFHEFQ 
NKVNKNVEDV PSHKVIVDFI SKNNEDYRFE TKENPIVALR DRKSDNTSIG RTSLS