Gene CPR_1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1410
Symbol
ID	4205511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1586942
End bp	1587919
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	34%
IMG OID	642565964
Product	T4 family peptidase
Protein accession	YP_698729
Protein GI	110802634
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.568813
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAAA TAAAGATTAC AGATATAGAT GGTTTTAAAC TAGGCCACGC TCAAGATTTT 
GAAGGTGCTA CAGGATGTAC AGTATTACTA TGTGAAGAAG GTGCTTCTGG AGGAGTTGAT 
GTTCGCGGTG GTGCTCCTGG AACTAGAGAA ACTGATTTAT TAAATCCTAT GGAAATGGTT 
GATAAAGTTC ATGCTGTAGT ATTATCTGGT GGATCTGCCT TTGGACTTGA TTCCTGCTCA 
GGGGTCATGG AATATCTAGA AAATAAAAAT GTTGGATTTG ACGTAGGGGT AACTAAAGTT 
CCTATAGTAT GTGGTGCTGT TTTATTTGAT TTAGCCTGTG GTAATCCTAA AGTAAGACCT 
AATAAGGAAA TGGGCTTAGA AGCTTGTAAA AATTCTGAAA CCTACTTTGA CTCAAAAAAC 
GGTAATATAG GTTGTGGAAC AGGTGCCACA GTAGGTAAAG CCTTAAATCA AAAACTTGCT 
ATGAAAGGCG GTTTTGGAAG CTATGCAGTT CAAATCGGAG ATTTAAAGGT AGGAGCTATT 
GTAGGAGTTA ATAGCCTAGG TGATATTGTT GACCCTAATG ATAACAATAA AATAATAGCG 
GGTGGATTAA GCCAAGATAT GAATTCCTTT ATGAACATAG AGAAAAGCTT ATTAGCTAAT 
TATTCTAATC CTAAAAATGT TTTTAAAGGA AATACTACTA TTGGGTGCAT AGTGACTAAT 
GGTGATTTTA ATAAAGCTGA GGCTAATAAA ATTGCATCTA TGGCTCAAAA TGGTTTTGGA 
AGAACCATTC GCCCTGCTCA CACTATGTTT GATGGTGATA CAATATTTAC TTTATCTTCA 
AATAAAGTTA AGGCAGATAT AAATGTAGTT GGTCTTTTAG CTGCTCAAGT TATGGAAAAA 
GCTATTATAA AAGCTGTTAA AGAAGCTGAT TCTTCATATG GATTCTTATC ACATAAAGAT 
TTAAAATTTA ATGTATAA

Protein sequence

MFEIKITDID GFKLGHAQDF EGATGCTVLL CEEGASGGVD VRGGAPGTRE TDLLNPMEMV 
DKVHAVVLSG GSAFGLDSCS GVMEYLENKN VGFDVGVTKV PIVCGAVLFD LACGNPKVRP 
NKEMGLEACK NSETYFDSKN GNIGCGTGAT VGKALNQKLA MKGGFGSYAV QIGDLKVGAI 
VGVNSLGDIV DPNDNNKIIA GGLSQDMNSF MNIEKSLLAN YSNPKNVFKG NTTIGCIVTN 
GDFNKAEANK IASMAQNGFG RTIRPAHTMF DGDTIFTLSS NKVKADINVV GLLAAQVMEK 
AIIKAVKEAD SSYGFLSHKD LKFNV