Gene CPR_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2201
Symbol
ID	4205951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2430446
End bp	2431429
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	27%
IMG OID	642566751
Product	alpha/beta fold family hydrolase
Protein accession	YP_699501
Protein GI	110803972
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGA ATATAAAAAT AAAGCCTATA AACGTAATTA GGAATATTTT TATATTTATA 
TTAGCTCTAG TATTTATAGG CTTTGCTTAT CAAATGATAT TAAATAAAAT TGATAGTAAA 
AAAATAGAAC CTGATACCAA GTATGTAAGA ATTGATAGCA AGAAAAATTA TTATAATTTT 
CAAGGAGAAA GCAAACCAAC TATAATAATG AGTTCTGATA TAGGCTTAGG GTTAAGTGAA 
TGGAGTAAGG TTCAAGAGCT TATAGAAAAG GAATATGGTT ATAGAACTTT TTCTTATGAT 
AGACCTGGAT ATGGTTTTTC AGAATCAGTA AAAGATGATG AAGTTAAAGA ACAAGCTCAG 
CATCTTAGAA TGATTCTGAA AAAATCAGGG ATTGGTGGAC CATATATACT TGTTGGAGAA 
GGATATGGTG GATTAGTAAT GTGTAACTTT GCAGAACTTT ATCCTGATTT AGTTCAAGGA 
GTTATTCTTG TAGATCCAAT AAGTGAAGAA GCTTTAAGTG AAAATAAAGA TTATATGAAA 
CAGTATTCAA GTCAAAAAAC TAGTAGATTT ATACAAAAGT GTGGTTCATA TTTTGGATTA 
ACATCAATAA TGAATAAATT TGGTATGTTG AAAAATACAA ATGGCTTAAG AGAAAATTTA 
AGTAATGAAA ATTTTAAGGT ATATAATATT TTAAGAACAA AAAGTGATTT TAATAGTGGA 
TATTATAGTG AGCTTACAAA TATTTTAGAG CAAAATAGTA GTTCACAAAA ATCTGGTTTA 
TTAAATGGTA AACCTTTGAG CATAATAGTT AATGATAATG CTTTTACTAA GGAGCAAGAG 
AGTTTAAAGA AACTCACTTT AGACAATAAA GTTCAAATAA TAAATGCTAA GAATAAGACA 
GATGTTATAC CTTTAGAAAA GCCAGAATTA TTTTTAGATA GCATAAGATT TATTCAAGAT 
AATAGCTTGG AAGAGCAGAA TTAG

Protein sequence

MNKNIKIKPI NVIRNIFIFI LALVFIGFAY QMILNKIDSK KIEPDTKYVR IDSKKNYYNF 
QGESKPTIIM SSDIGLGLSE WSKVQELIEK EYGYRTFSYD RPGYGFSESV KDDEVKEQAQ 
HLRMILKKSG IGGPYILVGE GYGGLVMCNF AELYPDLVQG VILVDPISEE ALSENKDYMK 
QYSSQKTSRF IQKCGSYFGL TSIMNKFGML KNTNGLRENL SNENFKVYNI LRTKSDFNSG 
YYSELTNILE QNSSSQKSGL LNGKPLSIIV NDNAFTKEQE SLKKLTLDNK VQIINAKNKT 
DVIPLEKPEL FLDSIRFIQD NSLEEQN