Gene CPR_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1965
Symbol
ID	4204513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	2171017
End bp	2172252
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	31%
IMG OID	642566515
Product	aminopeptidase
Protein accession	YP_699274
Protein GI	110802497
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAT TTGAAAGCAT GTTAGAAAAT TATGCAAAAT TAGCTACTCA TATAGGAGTA 
AATGTTCAAG AGGGTCAAAC CCTTGTTATC TCTTCTCCTG TAGAATGTGC AGAATTTACA 
AGAATGCTTG TTAAATCTGC TTATGAAAAA GGAGCAAAGG ATGTTGTTGT TCAATGGAAT 
GATGAAATAT GCGGCAAAAT CAAATATGAA CACTCTCCAT TAGAAGTTTT TGAAAACTTT 
CCAGATTGGA TGAAAGAATC AAGATTAAGT TATGCTAAAG AAGGAGCTTG CTTCTTAAGT 
ATTTCTGCCT CTGATCCTGA ACTTCTAAAA AATATAGACC CTGCAAAAAT AGCAGCCTTT 
AGAAAATCAT CAAGTACAGC TTTAAAAGAA TTTAGTGAAA TGTTAATGAG CAATAAAAAT 
TCATGGTCAA TAGTTTCTAT TCCAACTAAA GCTTGGGCTA AAAAAGTTTT CTCTGATTTA 
CCTGAGAAAG AAGCAGTAGA TAAATTATGG AATGAAATCT TTAAAATAGT TAGAGTTGAT 
ACAGAGAACC CTGTTGAAGC TTGGAATAAA CATAAAGAAA CTTTAAAATA CCATATGGAT 
TATTTAAATG AAAAGAATTT AAAATCACTT CATTTTGAAA ATTCACTTGG AACTGATTTA 
ACTATAGAAT TACCAGAAAA TCATCTTTGG GCTGGTGGAG CTGAATACAC TCAAGATGGA 
GTTGAATTCA TAGCTAATAT GCCTACTGAG GAAGTATTCT CTATGCCTTC TAAATTTGGA 
GTTAATGGAA CAGTATTTAG TTCTAAACCT TTAAACTACG GTGGAAATTT AATAGATAAT 
TTCTCAGTTA CTTTTAAAGA TGGAAAAGTT GTTGATTTCT CAGCTAAAAA AGGATACGAC 
ACTTTAAAAC ATCTTCTAGA TACTGATGAA GGTGCTAAAT ACTTAGGAGA AGTAGCTCTT 
GTTCCTTATA ATTCTCCTAT ATCAAACTCA GGAATAATTT TCTTCAACAC TCTATATGAT 
GAAAATGCTT CTTGTCATTT AGCTTTTGGT AAAGCATATT CTCTATGCAT AAAAAATGGT 
GAAAATATGA CTAATGAAGA GCTTGAAAAA GCTGGAGCTA ATGATTCATT AACTCATGTA 
GATTTTATGA TAGGAACTAA AGATTTAAAA ATTACAGGTT TAACTCATGA TAATGTTGAA 
ATTCCAGTAT TTAAAGATGG TAACTGGGCA TTTTAA

Protein sequence

MNKFESMLEN YAKLATHIGV NVQEGQTLVI SSPVECAEFT RMLVKSAYEK GAKDVVVQWN 
DEICGKIKYE HSPLEVFENF PDWMKESRLS YAKEGACFLS ISASDPELLK NIDPAKIAAF 
RKSSSTALKE FSEMLMSNKN SWSIVSIPTK AWAKKVFSDL PEKEAVDKLW NEIFKIVRVD 
TENPVEAWNK HKETLKYHMD YLNEKNLKSL HFENSLGTDL TIELPENHLW AGGAEYTQDG 
VEFIANMPTE EVFSMPSKFG VNGTVFSSKP LNYGGNLIDN FSVTFKDGKV VDFSAKKGYD 
TLKHLLDTDE GAKYLGEVAL VPYNSPISNS GIIFFNTLYD ENASCHLAFG KAYSLCIKNG 
ENMTNEELEK AGANDSLTHV DFMIGTKDLK ITGLTHDNVE IPVFKDGNWA F