Gene CPF_1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1780
Symbol
ID	4203683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	2006482
End bp	2007819
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	27%
IMG OID	638082652
Product	putative lipoprotein
Protein accession	YP_696216
Protein GI	110799805
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0111694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC TTTTTACAAC TTCCCTATTA ATTCTTTCAA TGATTTTTCT AATAGGATGT 
GGATCTAAAG GGGAAAGCAA AAACTTTGGG CTATCTGTAT TTGGATTAGA AAAATTTTCA 
GGACTAGATA AACCTGAAGA TAATATTAAA ATAAATCTAA ATGGTAAAGT TCAAGACTTA 
AGCTTACCAA TATACTTAGA TAAAAATAGA TATCTAATTC CTATAAGCGA AATAATCAAA 
AATAACAATG GGGAGTTTAA AATAGAGGAT GATTTTTTAA ATATTAAATT TGAAAATAAA 
GATATTAAAG TTAATTTAAA AGATAATACT TGGACTAATT TATCAAAGGA AGAATCAGAG 
GCTAATAAAT TTAAAATTGA CCCTATAATA AAAGATGATA CTGTATATAT GTCTTTAATT 
GACTTTGCTA ATATGTTTGA TTTAAAAAGC AGATGGAACT CAAAGGACAA GCTAATAAAA 
TTATATAATA ATAAAGATAT GTTAGATGTT AAACACTATA AGGGAAAAGG CCCTCAAAAA 
GGTATTATAA GATTTGAAGA TGTTGCATCT ACTGGTGCTG GAACAGAATA TGATTCACAA 
TATCTTGAAA CTATAAGAGT TATGGGGAGA TATTTAGGTA AAAAAAATGT ACCTTACCAT 
ATAGCTTGGA TACCTAGATA TATAGACCCA GAAAAGAAAA TAGACAATGA CCCTTCTAAA 
GAAAATAACT TTGCTAATGC TGAGCTTGTA TACACTTTAG ACTTTGTAGC TTCTCATAAA 
GGGGAAATAG GTTTACATGG TTATACCCAT CAAATAGACA ATACAATTAG TGGTCATGGC 
TTTGAATTTG GAAAATATAA CCCCTCTGTG GAGGATTTAA ATACAAGAGT TGATAAAGCT 
CTTCAAATAG CTAAAGATCT TGATATAAAA ATAAACTTCT TTGAAGCTCC TCATTACACT 
ATAAATAAAG CTCAAAATGA AGCTTTAGAA AAGAACTTTA AATATATATT TAATGATTAT 
GATGAAAATA AAGCACAATC AAAGCCTATG AAATCACCAA CTGGAAGTGG TTCTTATTAT 
GTACCTACAC CTCTATATTA TATTGAGGGC GGTAAAGAAA ATGATATGTT AAATAAGATA 
AAAAACATGT CTAATACTAC TTTTGCTGGA ATGTTTTATC ATCCATTTTT AGAAGCTAAA 
CTAATAGATT TTAAAGATGG ACAAGATGGT TATCCTGAAG ATAATTATAA AAAACCATCT 
ATAATCCAAA AAGTAATTGA TGAATTTGAA AAAAGAAATG TATCTATTAT TTCAATAGAA 
CAAGTTTCTG AAAAATAA

Protein sequence

MKKLFTTSLL ILSMIFLIGC GSKGESKNFG LSVFGLEKFS GLDKPEDNIK INLNGKVQDL 
SLPIYLDKNR YLIPISEIIK NNNGEFKIED DFLNIKFENK DIKVNLKDNT WTNLSKEESE 
ANKFKIDPII KDDTVYMSLI DFANMFDLKS RWNSKDKLIK LYNNKDMLDV KHYKGKGPQK 
GIIRFEDVAS TGAGTEYDSQ YLETIRVMGR YLGKKNVPYH IAWIPRYIDP EKKIDNDPSK 
ENNFANAELV YTLDFVASHK GEIGLHGYTH QIDNTISGHG FEFGKYNPSV EDLNTRVDKA 
LQIAKDLDIK INFFEAPHYT INKAQNEALE KNFKYIFNDY DENKAQSKPM KSPTGSGSYY 
VPTPLYYIEG GKENDMLNKI KNMSNTTFAG MFYHPFLEAK LIDFKDGQDG YPEDNYKKPS 
IIQKVIDEFE KRNVSIISIE QVSEK