Gene CPR_1167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1167
Symbol
ID	4206611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1311834
End bp	1312979
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	32%
IMG OID	642565723
Product	malate oxidoreductase (NAD) (malic enzyme)
Protein accession	YP_698489
Protein GI	110801879
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.641999
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAGG ACGAATTATT AAAACAAAGA GAATTAGCTC ATGGATTAAT AAGTATAAAA 
CCTAATTTTG ATATAAATAA TAGAGAACAA TTATCACAAA TATATACTCC TGGAGTATCA 
ACTATTTGTA AAGAGGTTGA GCATCATCCT AGTATGCTGA AAACACTAAC TTCTGTTGGA 
AATTCAATAG CTGTTATAAC AGATGGTACT GCGGTTTTAG GTCTTGGGAA TATAGGTACC 
CTTGCAGGAT ATCCTATAGT AGAGGCTAAA GCTTTAGTTT ATAAAGATCT AGCTGGTGTA 
AACGCTATCC CATTATGCGT TGATCAAATA GGATGCAATG AATTAATTAA AACAATAAAA 
AATATATATT CAAGTTTTAG TGGAATTCAT CTTGAAGATA TAAAGGCACC GGAATGCTTT 
TATATAGAAG ATGAACTTAA AAAAACTTTA AATATTCCAG TTTATCATGA TGACCAACAT 
GGTACTGCCA TTGCTGTTTT AGGGGCTCTT TATAATGCAT CTAAGGTAGT TAATAAGGAT 
TTTTCAAAGT TAAAGGTATT AATTTTAGGG GCAGGAGCTT CAGGAATTGC AACAGCAAAA 
TTATTATTAA AGGCTGGAAT AGAAGATATT ATATTAGTTG ATAAGAATGG AGCTTTAGTT 
AGTGGTGATG AAACTCTTAA TGATCCTCAA AAAGAAATGG CTAAAATAAC AAATAAAGAA 
TTAAAAAAAG GAACTTTGGA AGAAGTAATT AAGGGAAGAG ATGTATTTAT AGGTTTATCA 
GAAGGGAATC TTGTAACTAA GGAAATGGTA GAAAGTATGA ATGAGGATCC TATAATATTC 
GCTTTAGCTA ATCCAACGCC AGAGATAAAA CCTGAAATTG CAAAGGAAGC TGGTGCAAGG 
GTTATTGCAA CAGGTGGACC TTCTTATCCA AATCAGATTA ATAATATATT GGTTTTCCCA 
GGACTATTTA AAGGATTATT AGAAGCTAAG GCAACTGATG TAACTTATGG TGTAATGATA 
GCAGTTAGTA AAAAATTAGC TTCCTTAGTT GAAAATCCAA CTGCTGAAAA AATAATACCT 
GGAGTATTTG ATGGTGATAT AGTTAAGTCT GTTTCTGAAA CTGTGGTAAA AAATATTGAG 
AAGTAG

Protein sequence

MTKDELLKQR ELAHGLISIK PNFDINNREQ LSQIYTPGVS TICKEVEHHP SMLKTLTSVG 
NSIAVITDGT AVLGLGNIGT LAGYPIVEAK ALVYKDLAGV NAIPLCVDQI GCNELIKTIK 
NIYSSFSGIH LEDIKAPECF YIEDELKKTL NIPVYHDDQH GTAIAVLGAL YNASKVVNKD 
FSKLKVLILG AGASGIATAK LLLKAGIEDI ILVDKNGALV SGDETLNDPQ KEMAKITNKE 
LKKGTLEEVI KGRDVFIGLS EGNLVTKEMV ESMNEDPIIF ALANPTPEIK PEIAKEAGAR 
VIATGGPSYP NQINNILVFP GLFKGLLEAK ATDVTYGVMI AVSKKLASLV ENPTAEKIIP 
GVFDGDIVKS VSETVVKNIE K