Gene CPR_1225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1225
Symbol
ID	4206126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1376330
End bp	1377526
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	33%
IMG OID	642565781
Product	amidohydrolase family protein
Protein accession	YP_698547
Protein GI	110803798
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0413476
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAA ATTTAATGAA TGAAGCTCAA GAAATAAAAG ACTTACTTGT AGCTTTAAGA 
AGAGATTTTC ATGAAAATCC TGAATTAGGT TTTGAAGAAT GGAGAACTTC AGGAAAAATA 
AAGGAATTTT TAACTAATGA AGGTATTGAA TATATAGAAA CTGCTAAAAC AGGAGTATGT 
GGCATAATAA AGGGCACACT AAAGGATGAC TCTAAAAAAG ATAGATGCAT AGCTTTAAGA 
GCTGACATTG ATGGTCTTCC TATGGATGAT AAAAAGACTT GTTCATATTC ATCAAAGGTT 
AAAGGAAGAA TGCATGCTTG TGGACATGAT GCCCACACAA CAATATTGTT AGGTGCAGCT 
AAATTATTAA GTAGACATAG AGATAAGTTT AGTGGTACTG TTAAGTTACT CTTTGAACCA 
GCAGAGGAAA CAACAGGCGG AGCTCCTATA ATGATAGAAG AAGGAGTTTT AGAAAATCCT 
AGAGTAGAAA AAATAATAGG CCTTCATGTT GAAGAAACTT TAGATGCCGG AGAAATAATG 
ATAAAAAAAG GAGTAGTTAA TGCAGCATCT AATCCTTTCA CAATAAAGAT AAAAGGAAGA 
GGAGGACATG GAGCTTATCC TCACATGGCT GTAGACCCTA TAGTTATGGC TTCTCAAGTT 
GTTTTAGGAT TACAAACAAT AGTAAGTAGA GAAATAAAGC CTGTAAATCC AGCAGTTGTT 
ACAGTAGGAA GTATAAATGG AGGAACTGCT CAGAATATAA TACCAGATGA GGTTATATTA 
AAAGGTGTTA TAAGAACAAT GACTCTAGAA GATAGAGCTT ATGCTAAGGA AAGACTAAGA 
GAAATAGCTA CATCTATTTG TACAGCCATG AGAGGTGAAT GTGAAATAGA TATAGAAGAA 
AGCTATCCAT GTCTTTATAA TAATAGCTCC GTTGTAGATT TAGTAACTGA AGCTGCAAAA 
GAAATTATTG GGTCTCAAAA TGTTAAGGAA CAAGAAGCAC CAAAGCTTGG AGTTGAAAGC 
TTTGCATATT TTGCCCTAGA AAGAGATTCA GCTTTTTATT TCTTAGGAGC TAGAAATGAG 
GAAAGAAATA TTATTTATTC AGCTCATAAT AGTAGATTCG ATATAGACGA GAATTTATTA 
CCAATTGGAG TTTCAATTCA ATGTAAAGCA GCATTAAATT ATTTGACAAG GGAGTAA

Protein sequence

MNINLMNEAQ EIKDLLVALR RDFHENPELG FEEWRTSGKI KEFLTNEGIE YIETAKTGVC 
GIIKGTLKDD SKKDRCIALR ADIDGLPMDD KKTCSYSSKV KGRMHACGHD AHTTILLGAA 
KLLSRHRDKF SGTVKLLFEP AEETTGGAPI MIEEGVLENP RVEKIIGLHV EETLDAGEIM 
IKKGVVNAAS NPFTIKIKGR GGHGAYPHMA VDPIVMASQV VLGLQTIVSR EIKPVNPAVV 
TVGSINGGTA QNIIPDEVIL KGVIRTMTLE DRAYAKERLR EIATSICTAM RGECEIDIEE 
SYPCLYNNSS VVDLVTEAAK EIIGSQNVKE QEAPKLGVES FAYFALERDS AFYFLGARNE 
ERNIIYSAHN SRFDIDENLL PIGVSIQCKA ALNYLTRE