Gene CPF_1787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1787
Symbol
ID	4203364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2014894
End bp	2015940
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	32%
IMG OID	638082659
Product	anaerobic sulfite reductase, C subunit
Protein accession	YP_696223
Protein GI	110800509
COG category	[C] Energy production and conversion
COG ID	[COG2221] Dissimilatory sulfite reductase (desulfoviridin), alpha and beta subunits
TIGRFAM ID	[TIGR02912] sulfite reductase, subunit C

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCATG ATATAGATAT TAAAAAAGTT AGATTAAATT GTTTTCGTCA ATCAAAGGTT 
CCAGGAGAGT TTATGCTTCA AATGCGTATT CCAGGAGGAA TAGTAGATGC TAAGTATTTA 
TCACAAATAC AAGAAATAGC AGAAACTTGG GGAAATGGAA CATTTCATAT GGGGATGAGA 
CAAACCTTTA ATATTCCAGG AATTAAATAT GAAAATATTC CAGCAGTAAA TAAATTTATA 
GAGAATTATT TACAAGAAGT TGAAGTTGAT AGATGTAATT GTGATATGAA AGTTGATGAA 
AATGGATATC CAACAATAGG TGCTAGAAAT GTTATGGCAT GTATCGGAAA TTCACATTGT 
ATAAAAGCAA ATGTTGATAC TAAGGATATG GCTAATAAAA TAGAAAAATT AGTATTCCCA 
TCACACTATC ATATAAAAGT ATCTGTAGCT GGATGTCCAA ATGACTGTGC TAAAGGGCAT 
TTCCAAGACT TTGGTGTTAT AGGACAAGCT AGAATGGAAT ATCACGAAGA AAGATGTATA 
GGTTGTGGAG CTTGTGTAAG AGCTTGTGAA CATCATGCTA CAAGAGTTTT AAGTTTAAAT 
GATAAAGGAT TAGTTGATAA GGATCCATGT TGTTGCGTTG GATGTGGAGA ATGTGTATTA 
GCATGTCCAG CAAGTGCTTG GACTAGAAAG CCAGAAAAAT ACTATAGAAT AGTTATAGGA 
GGAAGAACAG GAAAACAAAC TCCTAGAATG GGTAAAACAT TTATAAACTT TGCAACAGAA 
GAAGTTGTTC TTGGTATCTT TGCTAACTGG CAAAAATTCT CTGCTTGGGC TTTAGATTAT 
AAACCAGAAT ATCTACATGG TGGTCACTTA ATTGATAGAG CGGGATATCA TAAATTTAAA 
GAAATAATTT TAGATGGAGT AGAGTTAAAT CCAGAAGCTT TAGTTGCAGA TAATATATTC 
TGGGCTGAAA CAGAGTATAG ATCAAACTTT AATGTTAAGC CAATAAAGAT GCATAAAACT 
ATAGAATCTA ATAGACCTTT AAGATAA

Protein sequence

MNHDIDIKKV RLNCFRQSKV PGEFMLQMRI PGGIVDAKYL SQIQEIAETW GNGTFHMGMR 
QTFNIPGIKY ENIPAVNKFI ENYLQEVEVD RCNCDMKVDE NGYPTIGARN VMACIGNSHC 
IKANVDTKDM ANKIEKLVFP SHYHIKVSVA GCPNDCAKGH FQDFGVIGQA RMEYHEERCI 
GCGACVRACE HHATRVLSLN DKGLVDKDPC CCVGCGECVL ACPASAWTRK PEKYYRIVIG 
GRTGKQTPRM GKTFINFATE EVVLGIFANW QKFSAWALDY KPEYLHGGHL IDRAGYHKFK 
EIILDGVELN PEALVADNIF WAETEYRSNF NVKPIKMHKT IESNRPLR