Gene Cphy_2291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2291
Symbol
ID	5745350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	2824360
End bp	2825640
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	37%
IMG OID	641293381
Product	peptidase U32
Protein accession	YP_001559391
Protein GI	160880423
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCGTA GAGAAAAACC GGAATTGTTA ATTCCAGCAA GTAACTTAGA AGTGTTAAAA 
ACAGCAATCA TATATGGTGC AGACGCTGTT TATATTGGCG GTGAGATGTA CGGTTTACGT 
GCAAAAGCGA AGAACTTTTC TTTAGATGAT ATGAAAAAAG GAATTGAATT TGCGCATCAG 
TATGGTAAAA AAGTTTATGT TACAGCCAAT ATAACAGCTC ATAACCGTGA TTTAAAAGGT 
GTAGAAGAGT ATTTCCGTGA ATTAAAAGAA GTTAAACCAG ATGCGTTAAT TATCTCTGAT 
CCAGGTGTAT TTGATATTGC AAAAGAGATT GTACCTGAGA TTGAGCTTCA TATAAGTACA 
CAAGCAAACA GTACAAATTA TCGTACTTAC CAGTTCTGGC ATAAGCAAGG TGCAGCACGT 
GTTGTTTCTG CACGTGAATT ATCTTTAGAA GAACTTTCTC AGTTACGCAC GAATATCCCA 
GATGAACTTG AGATTGAAAC CTTTGTTCAT GGCGCGATGT GTATCTCCTA TTCTGGACGT 
TGTCTCTTAA GTAATTACTT TACTGGAAGA GATGCAAATC TTGGAGCCTG CACACATCCT 
TGTAGATGGA AATATCACGT TGTTGAAGAG ACAAGACCAG GGGAATACAT GCCTGTATTT 
GAAAATGATC GCGGAACTTA TATCTTTAAT TCCAAAGACC TTTGCATGAT TGAGTATATT 
CCTGAACTTG TTGCAGCAGG AATTGATAGC TTAAAGATTG AAGGCCGTAT GAAGACCGCT 
CTTTATGTTG CTACAGTAGC AAGAACATAC CGTAAAGCTA TCGATGATTT CTATGAGTCT 
GTTGATAAAT ATCGTGAGAA CATGGAGTAT TATAAAGCAG AAATCGGAAA GTGTACGTAC 
CGCCAGTTTA CTACAGGTTT CTTCTTCCAA AAGCCAGATT CCAATACACA AATTTACGAT 
AACAATGTTT ATGTAAAAGA GTATACTTAT TTAGGAATCG TTTCTTCTCG TAATGCAGAA 
GGTGCTAGTG AGATGGAGCA GAGAAATAAG TTTACTGTAG GCGATATGGT TGAAATTATG 
AAGCCAAATG GTGAGAATAT TCCTACCAAG GTTTTAAGAA TCACAGATGA GGAAGGAAAT 
GAGATGGAGA GCTGCCCTCA TCCACAACGA AAGATTTTTG TTACCTTTGA TAAAGAGACC 
TCTCAATATG ATATCATACG TGTTCAAGAG AAATCCGATA ATTCTAAAAA GGATTGTGGA 
TGTACTTCTT GCGGTGAATA A

Protein sequence

MFRREKPELL IPASNLEVLK TAIIYGADAV YIGGEMYGLR AKAKNFSLDD MKKGIEFAHQ 
YGKKVYVTAN ITAHNRDLKG VEEYFRELKE VKPDALIISD PGVFDIAKEI VPEIELHIST 
QANSTNYRTY QFWHKQGAAR VVSARELSLE ELSQLRTNIP DELEIETFVH GAMCISYSGR 
CLLSNYFTGR DANLGACTHP CRWKYHVVEE TRPGEYMPVF ENDRGTYIFN SKDLCMIEYI 
PELVAAGIDS LKIEGRMKTA LYVATVARTY RKAIDDFYES VDKYRENMEY YKAEIGKCTY 
RQFTTGFFFQ KPDSNTQIYD NNVYVKEYTY LGIVSSRNAE GASEMEQRNK FTVGDMVEIM 
KPNGENIPTK VLRITDEEGN EMESCPHPQR KIFVTFDKET SQYDIIRVQE KSDNSKKDCG 
CTSCGE