Gene CPF_0868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0868
Symbol
ID	4203588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1032227
End bp	1033354
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	34%
IMG OID	638081751
Product	metalloprotease
Protein accession	YP_695318
Protein GI	110800906
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0549814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGATC AAAGATTAAA TAAGTTAGCT AAACTGCTTG TAAATTATTC AACAGGAGTT 
AAGGAAGGAG ACTTTGTTTT TGTATCTTGT AATGAGGTTG CAAATCCTTG GCTTACTGAA 
GTAGTAAAGG AAGCTACTAA GGTAGGAGCT CATGTTGAGT ATATTTTAGA ATCAGAAGAA 
GCTAAGGAGG CAAGACTTAA ATTTTCTACA AAGGATCAAT TATTATCAGG GAATTTAATG 
ATGGAAACTA TGCTTGAAAA GGCAGATGTT TGGTTAAGTG CATGGGGAGC TAGAAATACT 
AGAGCCTTTA GCAATATAGA TTCAGAAAAA ATAAAAGATA GCAGAGCTGG AGAAAAGGGA 
TGGAGAAAGT TCTATTCAGG AAGAATGGGA GATGGTTCTT TAAGATGGTG TGGAACTCAA 
TTTCCTACAT ATGCAGATGC ACAGGAAGCT TCAATGAGTT TTAGTGAATA TGAAGATTTT 
GTTTATGGAG CAGGACTTTT AGACGATGAA GATCCTGTGG CAGAATGGAA TAGAGTAAGC 
AAAGAACAAG AAAGATGGGT TAAATATTTA GATACTAAAA AAGAACTTCA TATTTTAGCA 
GAAGGAACTG ATATTAAGGT TTCAGTAGAG GGAAGAAAGT GGATAAATTG TGATGGTAGA 
GTAAACTTCC CAGATGGTGA AATATTTACA TCACCAGTTG AAAATAAGAT AAATGGACAC 
ATAACTTTTT CATTCCCAGG GATTTATGCA GGAAAGGAAA TAGAAGGTAT AGAACTTGAA 
GTTAAAGATG GTAAAGTTGT TTCATATAAA GCTAAAAAAG GAGAAGATTT ATTAAAGGCT 
TTATTAGAAA CTGATGAAGG AGCAAGCCAT TTTGGAGAAG TAGCTATAGG TACAAACTAT 
GGAATTAAGA AGTTTACTAG AAATATGCTA TTTGATGAGA AAATAGGAGG AACAGTTCAT 
ATGGCTATAG GAGATTCTAT GCCAGAGGCT GGTGGTAAAA ATAGATCATC ACTTCATTGG 
GACATGCTTT GTGACATGAG AAATGGTGGA AGAATATATG CAGATGGAGA ACTTTTCTAT 
GAAAATGGAG AGTTTAAAAA AGAAATATTA GAAAAATATA ATCTTTAA

Protein sequence

MADQRLNKLA KLLVNYSTGV KEGDFVFVSC NEVANPWLTE VVKEATKVGA HVEYILESEE 
AKEARLKFST KDQLLSGNLM METMLEKADV WLSAWGARNT RAFSNIDSEK IKDSRAGEKG 
WRKFYSGRMG DGSLRWCGTQ FPTYADAQEA SMSFSEYEDF VYGAGLLDDE DPVAEWNRVS 
KEQERWVKYL DTKKELHILA EGTDIKVSVE GRKWINCDGR VNFPDGEIFT SPVENKINGH 
ITFSFPGIYA GKEIEGIELE VKDGKVVSYK AKKGEDLLKA LLETDEGASH FGEVAIGTNY 
GIKKFTRNML FDEKIGGTVH MAIGDSMPEA GGKNRSSLHW DMLCDMRNGG RIYADGELFY 
ENGEFKKEIL EKYNL