Gene CPF_1143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1143
Symbol
ID	4203761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1304725
End bp	1306764
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	29%
IMG OID	638082024
Product	hypothetical protein
Protein accession	YP_695589
Protein GI	110799978
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5337] Spore coat assembly protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.513503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAAATG AAAAGGCAAG TAAATATATT TCTCTAATAA GTATTTCCTT AGCTGTCATA 
TTTGTTTTTG TATCCGTATT TGCTTTAAAG TCATTTAATT CTACAGAAGC ACTTAGTACT 
AGTGGACAAT CTTCTACTAT TGATACGGTT TTAAATAAAA ATATTGTAAC TGATATAGAT 
ATAAAGATAA AAGAAAGTGA TTGGGAATGG TTAATTGAAA ATGCTACAGA TGAGGAATAT 
AGAAGTGCAG ATATAACTAT AAATGGAGAA ACTTTTTATA ATGTTGGGGT TAGACCTAAA 
GGAAATTCAA GTTTATCCTC TGTTGCAAAT GATGATACAA CAGATAGATA TAGTTTAAAA 
ATAGATTTTG GACAATATGT TGACGGACAG ACCTATCATG GAATAAGAAA ACTAGCTTTA 
AATAATAATA TATCTGATGC CACTTATATG AAGGAAGCAA TATCTTATGA CATATATAAT 
TTTCTTGGGA TTCCTACTCC AGAGTATTCT TATTCAAACA TAAAGATTAA TGGAGAACAG 
TGGGGATTAT ATTTAGCATT AGAAGTAATT GAGGAGAGAT TTGTTGAAAA AAATTATGGT 
GAATTAGAAG GTAATTTATA TAAACCTGAA ACTATGGGAG TAGGGGCAAA AAAAGATGAA 
GGAAATAAAG ATGCCATGCC TGATATGAAA AATAATCAAG GAAGAGAAGG GGGAATGATG 
AATCCACCTA ATATGCCTAA CAATGAAGGA AATAATAAAG AGGGTAATAA ACCTATGAAT 
ATTCCTAATG AAAATCAAAA TATGGCTGGC AATATGAATA AAGAAAATGC AGGAATGGGA 
CAAATGTCTC CTATGATGGG AGGAAAAAAT AATGAAGGTG CTGATTTTAA ATATATAGAT 
GATAATATTA GCAGTTATTC TACTTTAAGA GATAGTGCAG TATTTAAGAG TACAACGGAT 
GAAGATTTTG AAAATGTAAT TGAAATGATG AAAAGTTTAG AAAATGGTAG GGATATAGAG 
AAATATTTAA ATGTTGATGA AGTTCTTAAG TACTTTGCAG TAAACACTTT CTTAGTTAAC 
CTAGATAGTT ATTCAGGTGG AATGTATCAT AATTATTATC TTTACGAAAA TAATGGAGTT 
TGTGAGATAC TTCCATGGGA CTTAAATTTA TCCTTTGGAG GATTTGCCAC AAATAGTGGA 
AGTAGAGCTG TAAATTTCCC TATTGATTCT CCTGTTACAG GTAATTTAGA AAATTTCCCT 
CTTATAGGAA AACTTTTAGA AAATGATGAA TATAAAGAGA AGTATCATGA GTATTTAGAT 
AAGATAGTAA ATGAATATTT TAAAAGTGGT ATTTTTAGTA CTACAGTTAC CAATAATGAT 
AAGTTAATAG GAGATTACGT AAAGATTGAT CCTACAGCAT TCTATACTTA TGATGAATAC 
AAAAATGCCA TTAAGGAGTT ATTAGTTTTT GGAGAGGATA GAACAAAGAG TGTAGAAGCT 
CAGTTAAATG GAGAGCAAAC ATCAACGGAA TATGGAAACA TTGAAACTTC ATTAAATTTA 
AAAGCCTTAG GTGAACAAAA TATGGGTGGA AAAATGCCTA ATGATAAGAT GAATGAAGAA 
AACTCAGTAA ATAATAATGA AGAAAATAAT AATGGACAAG CTATTCCAGA AGGTGGAAGA 
CCTTTTAATG GAGGAAACAT GGGAGAAGCT CCTAATAATA TTAATAATCC TAATGGTAAT 
ATGGATAATA AAATACCTAA TATGGGAAAC ATGCCTACAC AAGAAAATAT ACAAGAGGCT 
ATGAAGATAT TGAATAACAG GGATTATTCA AGCTTAAGCG AAGAGGAAAA GAGACAATTA 
AATGATTTAG GAATAAGTGA AGAAAATATA AATATGTTTA ATAATATTCC TAAACAAGGA 
GAAAGAGGAG AAGTTAGAGA AACCTTTAAT AAAACATATT ATGTAATATT TGGAGGAGTT 
ATCCTAACAC TATTAATTTC CCTAGTTTTT GTAACAAAGT ATAAAAGAAA AAGATACTAA

Protein sequence

MINEKASKYI SLISISLAVI FVFVSVFALK SFNSTEALST SGQSSTIDTV LNKNIVTDID 
IKIKESDWEW LIENATDEEY RSADITINGE TFYNVGVRPK GNSSLSSVAN DDTTDRYSLK 
IDFGQYVDGQ TYHGIRKLAL NNNISDATYM KEAISYDIYN FLGIPTPEYS YSNIKINGEQ 
WGLYLALEVI EERFVEKNYG ELEGNLYKPE TMGVGAKKDE GNKDAMPDMK NNQGREGGMM 
NPPNMPNNEG NNKEGNKPMN IPNENQNMAG NMNKENAGMG QMSPMMGGKN NEGADFKYID 
DNISSYSTLR DSAVFKSTTD EDFENVIEMM KSLENGRDIE KYLNVDEVLK YFAVNTFLVN 
LDSYSGGMYH NYYLYENNGV CEILPWDLNL SFGGFATNSG SRAVNFPIDS PVTGNLENFP 
LIGKLLENDE YKEKYHEYLD KIVNEYFKSG IFSTTVTNND KLIGDYVKID PTAFYTYDEY 
KNAIKELLVF GEDRTKSVEA QLNGEQTSTE YGNIETSLNL KALGEQNMGG KMPNDKMNEE 
NSVNNNEENN NGQAIPEGGR PFNGGNMGEA PNNINNPNGN MDNKIPNMGN MPTQENIQEA 
MKILNNRDYS SLSEEEKRQL NDLGISEENI NMFNNIPKQG ERGEVRETFN KTYYVIFGGV 
ILTLLISLVF VTKYKRKRY