Gene CPR_1644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1644
Symbol
ID	4206326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1835613
End bp	1837148
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	34%
IMG OID	642566194
Product	phosphodiesterase
Protein accession	YP_698959
Protein GI	110803608
COG category	[R] General function prediction only
COG ID	[COG1418] Predicted HD superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR03319] conserved hypothetical protein YmdA/YtgF

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGTAG GAATACTTAT AGGAATAATA ATATTAGGAG TGGTAGGGTT TATTCAATAC 
ACTCTTATAG AAAAAGCTTC AAAAAATAGG GTGGAAAGCT TGGAAAAAGA AGCTAGCTTA 
GCGCTAGAAG AAGCTAAAAG AGAAGCTGAA TCAACAAAGA AAGAAGCCAT ATTAGAAGCT 
AAAGAAGAGG TGCACAAACT AAGATCGGAT CTTGATAAAG AAATTCGTGA TAGAAGAAAT 
GAGATTCAAA GGTTTGAAAG AAGACTTATC CAAAGGGAAG AGTCATTAGA TAAAAAAGGT 
GAAATGCTTG AAAAAAGAGA AGATAGCATA AACAAAAAAT CTATAGAGAT TCAAGAACTT 
GAAGAACGTG TACAAAGTTT ATACGGTGAA CAAAGAGCTG AACTTGAGAG AATTTCAAAT 
CTTTCAAGTG AAGATGCAAG AACATTATTA TTAGATGAAG TAAGAAGAGA AATAAAACAT 
GAATCAGCTA TGCTGATCAA AGAACTTGAG ACTAAGGCCA AAGAAGAAGC TGACAAAAAA 
TCAAGAGAAA TAATTACTAA TGCTATTCAA AGATGTGCAG CAGATCATGT TTCTGAAACT 
ACAGTACATG TTGTTGCCTT ACCTAATGAT GAAATGAAAG GAAGAATCAT TGGTAGAGAA 
GGTAGAAATA TAAGAACTTT AGAAACTTTA ACAGGAGTTG ATTTAATAAT TGATGATACT 
CCAGAAGCTG TTATTCTTTC AAGCTTCGAT CCAATAAGAA GAGAAGTTGC TAGAATAGCT 
TTAGAAAAAT TAATTGTAGA TGGAAGAATT CATCCAGCTA GAATTGAAGA AATGGTAGAA 
AGAGCTATTA AAGATGTAGA AAATGACATT AAGGAAGAGG GAGAACAAGC AACTTTCGAA 
ACTGGTGTTC ATGGATTACA TCCAGAAATA ATTAAGCTTC TAGGAAGACT AAAGTACAGA 
ACAAGTTATG GTCAAAATGT TTTAAAACAT TCAATAGAGG TTTCATATTT AGCAGGATTA 
ATGGCATCTG AATTAGGTTT AGATGTAAAT CTAGCTAGAA GAGCAGGTCT TTTACATGAT 
ATAGGTAAAG GGGTTGACCA AGAATATGAG GGTCCTCATG CTGTTATAGG TGGAGAACTT 
GCAAAGAAAT ATCATGAATC ACCAGCTGTG GTAAATGCTA TAGCAGCCCA TCATGGTGAT 
ACAGAAATGC AAACTCTTGA AGCAGTACTT GTTCAAGCAG CCGATGCTAT ATCAGCAGCT 
AGACCAGGTG CAAGAAGAGA AACTTTAGAA GCTTATATTA AGAGATTAGA AAAATTAGAA 
GAAATAGCTA CTTCATATGA AGGTGTAGAA AAGTCATATG CCATTCAAGC TGGAAGAGAA 
ATTAGAATTA TGGTTAAACC AGATCAAGTT GACGATGCAG GGGCAATTGA AATGGCAAGA 
AATATTGTTA AGAAAATAGA AGAACAATTA GAGTATCCAG GTCAAATCAA GATAAATGTA 
ATAAGAGAAA CCCGTGCAGT TGACTATGCT AAATAA

Protein sequence

MVVGILIGII ILGVVGFIQY TLIEKASKNR VESLEKEASL ALEEAKREAE STKKEAILEA 
KEEVHKLRSD LDKEIRDRRN EIQRFERRLI QREESLDKKG EMLEKREDSI NKKSIEIQEL 
EERVQSLYGE QRAELERISN LSSEDARTLL LDEVRREIKH ESAMLIKELE TKAKEEADKK 
SREIITNAIQ RCAADHVSET TVHVVALPND EMKGRIIGRE GRNIRTLETL TGVDLIIDDT 
PEAVILSSFD PIRREVARIA LEKLIVDGRI HPARIEEMVE RAIKDVENDI KEEGEQATFE 
TGVHGLHPEI IKLLGRLKYR TSYGQNVLKH SIEVSYLAGL MASELGLDVN LARRAGLLHD 
IGKGVDQEYE GPHAVIGGEL AKKYHESPAV VNAIAAHHGD TEMQTLEAVL VQAADAISAA 
RPGARRETLE AYIKRLEKLE EIATSYEGVE KSYAIQAGRE IRIMVKPDQV DDAGAIEMAR 
NIVKKIEEQL EYPGQIKINV IRETRAVDYA K