Gene CPR_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1901
Symbol
ID	4204740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2099452
End bp	2100894
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	29%
IMG OID	642566451
Product	coproporphyrinogen III oxidase
Protein accession	YP_699211
Protein GI	110802256
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATATTA AAATATATCT TAATGACTTA AAGTATAGAT ATGACGTTTA TCAAATGTTT 
AATATATTCT ATACTTTTAA GGAATTAAAG TTTGTAAATG AAGATGAAGA GAGAGACTAC 
GATGTCTTTA TATCTGAAAA TATGGTTAAA ATTTCAGAGG GAGACAATAG TTTTTCTTAT 
GAATTCAAAG AAGGATACGG ATTTAAAACT GAACTTAAAA AGGGAATATT CAAATTTTTA 
TCTGAAACTC TTAAGGATGA ATATCCTTGG GGAACATTAG TTGGAATAAG ACCAAGTAAA 
ATAGCATTAT CTCTAATAAG AGAAGGAAAA TCTGAGGAAG AGATAATAAA ATATTTTGAA 
GATAATTATA TGGCTAGGGA AGAAAAAGCT AAGCTTTGCA TAGAAGTTGC AGAAAGAGAA 
GAAAGTTTTG TAAACAAAGA GGAAAAAAAC ATAAGTATAT ATGTTGGTAT GCCTTTTTGT 
CCTACAAGAT GCCTTTATTG TTCCTTTGCA GCAAATCCTA TAGCTGGATG CAAGAAAGAT 
GTTGAGCCTT ATTTAGAAGC TTTAAGCAAA GAAATTTCAG CTATAAGTGA TTATGTATCA 
AAGAAAGGCT TAAAGATAGA AACTGTTTAT TTTGGTGGAG GCACTCCAAC CTCAGTAAAT 
AATGAACAGT TTGAAGTATT AATGAAACAT ATATATGATA GTTTCGTTAA TAATAAAGGA 
ATAAAGGAGT TCACTGTTGA ATGTGGAAGA CCTGATTCTA TAACTGAAGA AAAATTAAAA 
ACTATGAAGA GATATGAAGT ATCTAGAATA TCTATAAATC CTCAAAGTAT GAACGATAAA 
ACCTTGAAAT CAATAGGTAG AGGGCATTTA ACAGAGGATG TAGTGGATAA ATTCAATTTG 
GCAAGAAGCT TAGACTTTGA TAACATAAAT ATGGATATTA TAATAGGTCT TCCAAATGAA 
GATATTTCAG AGGTTTCTAA AACATGCTCT ATGATAAAGG AGCTTAATCC AGATAGTTTA 
ACTATTCATG GTATGTCTAT TAAAAGGGCA TCAAGACTTC ATGAAAATTT AGTTTTACAT 
AATACTATAA CTATTGCAGA GCAAAAAAAT CTTAATAAGA TGTATGAGAT GAGTAAAGTT 
TTAGGTAGAG AACTAAATAT GCATCCATAT TATATGTATA GACAAAAAAA TATGGTTGGT 
AATATGGAGA ATGTAGGATA TTCAAAAGAT AACAAGGAAT GTATCTACAA TATTCAAATG 
ATTGAAGATA AGCAAACTAT AATTGCACTA GGAGCAGATG CCGTTTCTAA GGTAGTGTTT 
TTAGAAGAAG ATAAAAATCG TATAGAAAGA TTTGCAAATG TTAAAGATGT AAAGGAATAT 
GTAAAAAGAA TAGAGGAAAT GGTTGAAGGT AAGATAGAAT TACTTGATAC TTTATATAAA 
TAA

Protein sequence

MYIKIYLNDL KYRYDVYQMF NIFYTFKELK FVNEDEERDY DVFISENMVK ISEGDNSFSY 
EFKEGYGFKT ELKKGIFKFL SETLKDEYPW GTLVGIRPSK IALSLIREGK SEEEIIKYFE 
DNYMAREEKA KLCIEVAERE ESFVNKEEKN ISIYVGMPFC PTRCLYCSFA ANPIAGCKKD 
VEPYLEALSK EISAISDYVS KKGLKIETVY FGGGTPTSVN NEQFEVLMKH IYDSFVNNKG 
IKEFTVECGR PDSITEEKLK TMKRYEVSRI SINPQSMNDK TLKSIGRGHL TEDVVDKFNL 
ARSLDFDNIN MDIIIGLPNE DISEVSKTCS MIKELNPDSL TIHGMSIKRA SRLHENLVLH 
NTITIAEQKN LNKMYEMSKV LGRELNMHPY YMYRQKNMVG NMENVGYSKD NKECIYNIQM 
IEDKQTIIAL GADAVSKVVF LEEDKNRIER FANVKDVKEY VKRIEEMVEG KIELLDTLYK