Gene Cphy_2844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2844
Symbol
ID	5742160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3476824
End bp	3478206
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	42%
IMG OID	641293936
Product	cysteine desulfurase
Protein accession	YP_001559943
Protein GI	160880975
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACT TCCAATGTAA TACCGCTATA AGTAATTCAA GCGATAATAT ACGTAATATG 
ATGTTTGGGC TGGACGCGCT GGTTGAGCTT GATAACAATA AAATGGTACC TGCTATTAAT 
TTAGATAATG CCGCTACTAC TCCACCTTTT AAGGAGGTCA TTCAAGAAAT AGAGCGACAG 
CTTATGTACT ATGGCTCCAT CGGTCGCGGT AAAGGACAAA AGTCTGAAAA TTCGACCGAG 
GTTTATACAA ACGGACGAGA TATCGTTAAG GATTTTGTTG GAGCAAACAG CGATATTTAT 
ACGGTTTTCT ACATCAATAA CGCGACAGAT GGAATAAATA AACTTGCGTC AGCTTTTATC 
GAAAGCCCTG AGGACATCGT TCTCTCAACT CGCATGGAGC ATCACGCAAA TGATTTGCCT 
TGGCGCGAGC GTACGAAAAC GGTATATGCT GAAGTAGATA AAAAAGGGCG GTTGATTGTC 
GATGATATAA AGAGGCTTCT TAAGGCGTAT AACGGCCGAA TTAAGTACGT TACAGTCACA 
GCGGCTTCCA ATGTCACAGG TTATGTGAAT GATGTGCACT ACATCGCTAA ACTCGCTCAT 
CAATATGGTG CAAAGATCAT TGTAGATGGC GCACAAATTG TCGCTCATCG AGCGTTTAAC 
ATGTTAGGGC AAACACTGGA AGAGAATATT GATTTTTTTG TTTTCTCAGC GCACAAAATG 
TACTCGCCTT TCGGCGGCGG TGCAGTGGTA GGGCTTACAG ATGTGTTAAA TAAGCATATA 
GCTAAATTTT ATGGTGGTGG TATGGTAGAG GCGGTATGTG ATTATTCAGT ACGCTATTTA 
CCAGCACCCG ATCGATATGA AGCGGGTTCA CCGAACTACC CAGGTGTAGT TGGAATGCTG 
AGAGCTATGG AAGTTCTTAA GTGTATTGGA TTTGATTATA TTAAAAACCA TGAGCAGATA 
CTTCTAAGAA GGGCACTGGA TGGACTTATG AAACTTCCGG GGGTGATACT CTACGGTGAT 
AATGAAAATA TTGCTGATAG AGTGGGCATT GCTGTATTTA CCCTTCGTGG CATAAAGAAT 
GAAGAGGTAG CAAATTTTCT CGCAGGTTAT CGTGCCATCG CTGTTCGCCA TGCTGCCTTT 
TGCGCCCACC CTTATGTTCG CCGTCTGACA GGGGGTTCAG ATACGTCGGG CTCATTTTGC 
TACCCCCTCG AAGGAATGGT GCGCATTAGC TTTGGAATAT ATAACAATGA AACTGATGTC 
GATACCTTTT TAGCAACGAT TAAAGAATTA CTATATAGTG AATACTTAAG ACACTTCGCA 
AGAGTTAAAA ATAATTCTGT TCAGTTATCA GATAGATTGT GCATACCATA TGACCGTGCT 
TAA

Protein sequence

MDNFQCNTAI SNSSDNIRNM MFGLDALVEL DNNKMVPAIN LDNAATTPPF KEVIQEIERQ 
LMYYGSIGRG KGQKSENSTE VYTNGRDIVK DFVGANSDIY TVFYINNATD GINKLASAFI 
ESPEDIVLST RMEHHANDLP WRERTKTVYA EVDKKGRLIV DDIKRLLKAY NGRIKYVTVT 
AASNVTGYVN DVHYIAKLAH QYGAKIIVDG AQIVAHRAFN MLGQTLEENI DFFVFSAHKM 
YSPFGGGAVV GLTDVLNKHI AKFYGGGMVE AVCDYSVRYL PAPDRYEAGS PNYPGVVGML 
RAMEVLKCIG FDYIKNHEQI LLRRALDGLM KLPGVILYGD NENIADRVGI AVFTLRGIKN 
EEVANFLAGY RAIAVRHAAF CAHPYVRRLT GGSDTSGSFC YPLEGMVRIS FGIYNNETDV 
DTFLATIKEL LYSEYLRHFA RVKNNSVQLS DRLCIPYDRA