Gene CPF_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2039
Symbol	iscS
ID	4202521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2279431
End bp	2280627
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	33%
IMG OID	638082906
Product	cysteine desulfurase
Protein accession	YP_696470
Protein GI	110800678
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATA GAGTTGTTTA TATGGACTAC TCAGCAACTA CATATGTTAA GCCAGAAGTA 
TTAGAGGAAA TGTTACCATA TTTCACAAAT AAGTTTGGAA ATCCATCAGC ATTTTACGGA 
GTTTCAAGAG AATCAAGAAT GGCTGTAGAC ACTGCTAGAG AAAGAGTAGC TAAAGTATTA 
AATGCTGATA CAAATGAAAT CTACTTTACT GGTGGCGGAT CAGAAGCAGA TAACTGGGCA 
ATAAAAGGAA TAGCTTTTGC TCATAAAAAT AAAGGAAATC ATATAATAAC TACAAAAATA 
GAGCACCATG CTGTATTACA TACTTGCCAA TGGTTAGAAA AACAAGGCTT TGAAGTAACT 
TACTTAGATG TAAATGAAGA AGGTTTTGTT GATTTAGAAG AATTAAAAAA TGCTATTACT 
GATAAAACTA TCTTAGTTTC TGTAATGTTT GCAAACAATG AAATAGGAAC TATAGAGCCA 
GTTAAGGAAA TAGGAAAAAT TTGTAGAGAA AGAAAAGTAA TATTCCATAC AGATGCAGTT 
CAAGCTGTAG GAAATGTAAA GATAGATGTT AAAGATATGA ACATCGATTT ACTTTCATTA 
GCTGGACATA AAGTTTATGG ACCAAAAGGA ATCGGAGCTT TATATATAAG AAAAGGTATA 
AGAATAGATA ACTTAATCCA CGGTGGTGGT CAAGAGAGAG CTAGAAGAGC TGGAACTGAG 
AACATACCTG CAATAGTTGG ATTAGGAAAG GCTATGGAAA TAGCTGGAGA AAACTTAGAT 
GAGCATATAG CTAAAATTTC TAAGTTAAGA GATAAGTTAA TAAAAGGATT ATTAGAAGTA 
CCATTTACAA GATTAAATGG ACCAAAAGAT GGTAGCAAGA GATTACCAGG TAACGTAAAT 
GTATGCTTTG AATTCATTGA AGGTGAAGGA ATTCTTCTTT CATTAGACTT TGAAGGAATT 
TGTGGTTCAA GTGGAAGTGC TTGTACATCA GGATCATTAG ATCCATCACA CGTGTTATTA 
GCAATAGGTT TACCTCATGA AATAGCACAC GGATCATTAA GATTAAGTTT AGGTGAAGGT 
ACAACTGAAG AAGACGTTGA TTACGTATTA GAAAAAGTAC CACCAATAAT CGCAAGATTA 
AGAAGTATGT CACCATTATG GAAAAATCAT TTAAGAGAAG TAGAAGGAGA GAATTAA

Protein sequence

MNNRVVYMDY SATTYVKPEV LEEMLPYFTN KFGNPSAFYG VSRESRMAVD TARERVAKVL 
NADTNEIYFT GGGSEADNWA IKGIAFAHKN KGNHIITTKI EHHAVLHTCQ WLEKQGFEVT 
YLDVNEEGFV DLEELKNAIT DKTILVSVMF ANNEIGTIEP VKEIGKICRE RKVIFHTDAV 
QAVGNVKIDV KDMNIDLLSL AGHKVYGPKG IGALYIRKGI RIDNLIHGGG QERARRAGTE 
NIPAIVGLGK AMEIAGENLD EHIAKISKLR DKLIKGLLEV PFTRLNGPKD GSKRLPGNVN 
VCFEFIEGEG ILLSLDFEGI CGSSGSACTS GSLDPSHVLL AIGLPHEIAH GSLRLSLGEG 
TTEEDVDYVL EKVPPIIARL RSMSPLWKNH LREVEGEN