Gene CPF_0029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0029
Symbol	pepT
ID	4203802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	37194
End bp	38414
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	31%
IMG OID	638080904
Product	peptidase T
Protein accession	YP_694498
Protein GI	110800422
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAG TTCATGAAAG GTTTTTAGAA TATGTAAAAG TAGATACTAA ATCAGATGAG 
ACAACAAGGG TTACTCCTAG TACAAAAGGT CAATTAGAAT TAGGAAAAAT CCTTGCAGAG 
GAATTAAAGG AAATCGGAGT AGATGAAGTA AGAATAAGTG ATAAAGGATA TGTATATGCT 
TGTTTAAAGA GTAATTGTGA TAAGGATATT CCGAAAATAG GATTTATTTC ACATATGGAT 
ACTGCACCAG ATATGAGTGG AAAAAATGTT AATCCTAAAA TTGTTGAAAA TTATGATGGT 
AAAGATATTG AACTTGGAAA TGGATATACA TTATCACCAA GTTTTTCACC AGAACTTCCA 
ATGTATAAAG GTCAAACTTT AATAACTACT GATGGAACTA CTCTTTTAGG CGCTGATGAT 
AAGGCAGGGG TAGCAGAAAT AGTAACAGCT ATTGAATATT TAATAAATAA TCCAGAAATA 
AAACATGGTG ATATTAAAAT AGGATTTACT CCAGATGAAG AAATTGGAGA AGGAGCAGAT 
CACTTTGATG TTGAAGGCTT TGGAGCAGAT TTTGCTTACA CATTAGATGG TGGAAGAATA 
GGTGAATTAG AATATGAAAA CTTTAATGCT GCAAGTGCTA AGGTTGAAAT AATAGGTAAA 
AATGTTCACC CAGGAAGTGC TAAAGGAAAA ATGATTAACT CTATTTTAGT TGCTCATGAA 
TTTGTTTCTA TGCTTCCTTT AGATGAAGTT CCAGAAAAAA CAGAAGGATA TGAAGGTTTC 
TCATTCTTAT TAGATATACA AGGTGAAGTA GAAAAAACTT CATTATCATT TATAATAAGA 
GATTTTGATA AAGAAGGCTT TAAAAATAGA AAAGAAAGAT TTAATGAAAT AGCTAAAGAG 
TTAAATAAAA AGTATGGAGA AGGTACTGTT ACAGTAACTT TAAAAGACCA ATACATGAAC 
ATGAAGGAAA TGATAGAACC TAGAATGCAT ATTGTAGAAA CTGCTGAAAA AGCAATGAAA 
CAATGTGGAA TTGAGCCAAT CAAAAATCCT ATAAGAGGAG GTACTGATGG GGCAAGATTA 
TCATTTATGG GACTACCAAC ACCAAATCTA TTTACTGGCG GAGAAAACTT CCATGGAAGA 
TATGAATATA TATCAATAAA TTCAATGGAA AAAGCTGTTG AAGTAATACT AAACATAATA 
AAAATTTATG CTGAAAAATA A

Protein sequence

MKKVHERFLE YVKVDTKSDE TTRVTPSTKG QLELGKILAE ELKEIGVDEV RISDKGYVYA 
CLKSNCDKDI PKIGFISHMD TAPDMSGKNV NPKIVENYDG KDIELGNGYT LSPSFSPELP 
MYKGQTLITT DGTTLLGADD KAGVAEIVTA IEYLINNPEI KHGDIKIGFT PDEEIGEGAD 
HFDVEGFGAD FAYTLDGGRI GELEYENFNA ASAKVEIIGK NVHPGSAKGK MINSILVAHE 
FVSMLPLDEV PEKTEGYEGF SFLLDIQGEV EKTSLSFIIR DFDKEGFKNR KERFNEIAKE 
LNKKYGEGTV TVTLKDQYMN MKEMIEPRMH IVETAEKAMK QCGIEPIKNP IRGGTDGARL 
SFMGLPTPNL FTGGENFHGR YEYISINSME KAVEVILNII KIYAEK