Gene CPR_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0855
Symbol
ID	4204317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	994737
End bp	995864
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	34%
IMG OID	642565414
Product	metalloprotease
Protein accession	YP_698180
Protein GI	110801468
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGATC AAAGATTAAA TAAGTTAGCT AAACTGCTTG TAAATTATTC AACAGGAGTT 
AAGGAAGGGG ACTTTGTTTT TGTATCTTGT AATGAGGTTG CAAATCCTTG GCTTACTGAG 
GTAGTAAAGG AAGCTACTAA GGCAGGAGCT CATGTTGAGT ATATTTTAGA ATCAGAAGAA 
GCTAAGGAGG CAAGACTTAA ATTTTCTACA AAGGATCAAT TATTATCAGG GAATTTAATA 
ATGGAAACTA TGCTTGAAAA GGCAGATGTT TGGTTAAGTG CATGGGGAGC TAGAAATACT 
AGAGCCTTTA GCAATATAGA TTCAGAAAAA ATAAAAAATA ACAGAGCTGG AGAAAAGGGA 
TGGAGAAAGT TCTATTCAGG AAGAATGGGA GATGGCTCTT TAAGATGGTG TGGAACTCAA 
TTTCCTACAT ATGCAGATGC TCAAGAAGCT TCCATGAGTT TTAGTGAATA TGAAGACTTT 
GTTTATGGAG CAGGTCTTTT AGACCATGAA GATCCTGTGG CAGAATGGAA TAGAGTAAGC 
AAAGAGCAGG AAAGATGGGT TAAATATTTA GATACTAAAA AAGAACTTCA TATATTAGCA 
GAAGGAACTG ACATTAAGGT CTCAGTAGAG GGAAGAAAGT GGATAAATTG TGATGGTAGA 
GTAAACTTCC CAGATGGTGA AATATTTACA TCACCAGTTG AAAATAAGAT AAATGGACAC 
ATAACTTTTT CATTCCCAGG TATTTATGCA GGAAAGGAAA TAGAGGGTAT AGAGCTTGAA 
GTTAAAGATG GTAAAGTTGT TTCATATAAA GCTAAAAAAG GAGAAGATTT ATTAAAGGCT 
TTATTAGAAA CTGATGAAGG AGCAAGCCAT TTTGGAGAAG TAGCTATAGG TACAAACTAT 
GGAATTAAGA AGTTTACTAG AAATATGCTA TTTGATGAGA AAATAGGAGG AACAGTTCAT 
ATGGCTATAG GAGATTCTAT GCCAGAGGCT GGTGGTAAAA ATAGATCATC ACTTCATTGG 
GACATGCTTT GTGACATGAG AAATGGTGGA AGAATATATG CAGATGGAGA ACTTTTCTAT 
GAAAATGGAG AGTTTAAAAA AGAAATATTA GAAAAATATA ATATTTAA

Protein sequence

MADQRLNKLA KLLVNYSTGV KEGDFVFVSC NEVANPWLTE VVKEATKAGA HVEYILESEE 
AKEARLKFST KDQLLSGNLI METMLEKADV WLSAWGARNT RAFSNIDSEK IKNNRAGEKG 
WRKFYSGRMG DGSLRWCGTQ FPTYADAQEA SMSFSEYEDF VYGAGLLDHE DPVAEWNRVS 
KEQERWVKYL DTKKELHILA EGTDIKVSVE GRKWINCDGR VNFPDGEIFT SPVENKINGH 
ITFSFPGIYA GKEIEGIELE VKDGKVVSYK AKKGEDLLKA LLETDEGASH FGEVAIGTNY 
GIKKFTRNML FDEKIGGTVH MAIGDSMPEA GGKNRSSLHW DMLCDMRNGG RIYADGELFY 
ENGEFKKEIL EKYNI