Gene CPR_0737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0737
Symbol	codA
ID	4206223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	862996
End bp	864258
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	30%
IMG OID	642565297
Product	cytosine deaminase
Protein accession	YP_698063
Protein GI	110803700
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.159604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCTA TTTTATTTAA AAATGCTAGA TTAAAAGGAA ATGAAACACT AGTTGATTTA 
CTTGTTGAAA ATGGAGTTTA TAAGGAAATA GGTCCAAATC TTTCTGAAAA ATATAAAGAT 
GTAGAAACTT ATGATTTAAA AGGAGATCTT GTTGTACCAC CTTATGTTGA TCCACATATT 
CATTTAGACT ATGTATATAC AGCTCGTATG CCTGGTGCAA ATAATGGAAC AGGAACTCTT 
TTTGAAGGAA TTCAAAGATG GTCTGAAACA AAAGGAAACA TGACAATAGA TGAAATTAAA 
GAACGTGCAA GAATAGCTCT TAAAAAAGAG ATTTTATATG GTACTCAATA TATGAGAACA 
CATGTTGACG TAACAGATCC TAAGTTTACA GGATTAAAAG CTATTATGGA ATTAAAAGAA 
GAATATAAAG ATATTATAGA TATTCAAATC ATAGCTTTCC CACAAGAAGG AATGTATTCT 
TATAAAGGTG GAGATGAATT AGTAGAAGAA GCTTTAAAAA TGGGTGCTGA TGTAGTTGGT 
GCTATTCCTC ACTTTGAATT CACAAGAGAA ATGGGAGAAA AATCAGTTAA GAAAACTGTA 
GAGCTTGCAA TGAAATATAA TAAATTAATT GACGTTCACT GTGATGAAAC TGATGATGAC 
CAATCAAGAT TTGTTGAATT ATTAGCAGCA GAAGCTTACT TAAATGGAAT TGGAGAACTT 
ACAACTGCAA GCCATACTTG TGCTATGGGT TCATATAATA ATGCTTATGC ATTTAAATTA 
TTCAAACTTT TAAAATTATC AAAAATGAAC TTCATATCAT GTCCAACAGA AAATATTCAC 
TTACAAGGAA GATATGACAC TTATCCAAAG AGAAGAGGTC TTACAAGAGT TAAGGAATTA 
AATGATGCAG GAATTAATGT TTGTTTTGCT CAAGACTCAA TTTCAGACCC ATGGTACCCA 
TTAGGAAATG GTAACCTAAT GAATATCTTA GATGCTGGTA TTCATATATG CCATATGATG 
TCTGTTGATG AAATTAATAA TGCCTTAGAT TTAATTACAA CAAATGGTGC CAAAACTCTT 
CATATACAAG ATAAATATGG TATAGAAGTA GGAAAAGATG CTAACTTCAT AGTTTTAAAT 
GCTAAAAATG AATTTGATGC AATCCTTGAA AGAGTTGGAG TTAACTGCTC TGTAAGAAGA 
GGAGAATTCC TATTTAAGAG AGAACCTGAA GTAATAGACA CAAAAATAAC TCTATTAAAA 
TAG

Protein sequence

MKAILFKNAR LKGNETLVDL LVENGVYKEI GPNLSEKYKD VETYDLKGDL VVPPYVDPHI 
HLDYVYTARM PGANNGTGTL FEGIQRWSET KGNMTIDEIK ERARIALKKE ILYGTQYMRT 
HVDVTDPKFT GLKAIMELKE EYKDIIDIQI IAFPQEGMYS YKGGDELVEE ALKMGADVVG 
AIPHFEFTRE MGEKSVKKTV ELAMKYNKLI DVHCDETDDD QSRFVELLAA EAYLNGIGEL 
TTASHTCAMG SYNNAYAFKL FKLLKLSKMN FISCPTENIH LQGRYDTYPK RRGLTRVKEL 
NDAGINVCFA QDSISDPWYP LGNGNLMNIL DAGIHICHMM SVDEINNALD LITTNGAKTL 
HIQDKYGIEV GKDANFIVLN AKNEFDAILE RVGVNCSVRR GEFLFKREPE VIDTKITLLK