Gene EcE24377A_2815 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2815
Symbol	iscS
ID	5586952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2810390
End bp	2811604
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	53%
IMG OID	640926466
Product	cysteine desulfurase
Protein accession	YP_001463853
Protein GI	157155974
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR02006] cysteine desulfurase IscS [TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00976282
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAC CGATTTATCT CGACTACTCC GCAACCACGC CGGTGGACCC GCGTGTTGCC 
GAGAAAATGA TGCAGTTTAT GACGATGGAC GGAACCTTTG GTAACCCGGC CTCCCGTTCT 
CACCGTTTCG GCTGGCAGGC TGAAGAAGCG GTAGATATCG CCCGTAATCA GATTGCCGAT 
CTGGTCGGCG CTGATCCGCG TGAAATCGTC TTTACCTCTG GTGCAACCGA ATCTGACAAC 
CTGGCGATCA AAGGTGCAGC CAACTTTTAT CAGAAAAAAG GCAAGCACAT CATCACCAGC 
AAAACCGAAC ACAAAGCGGT ACTGGATACC TGCCGTCAGC TGGAGCGCGA AGGTTTTGAA 
GTCACCTACC TGGCACCGCA GCGTAACGGC ATTATCGACC TGAAAGAACT TGAAGCAGCG 
ATGCGTGACG ACACCATCCT CGTGTCCATC ATGCACGTAA ATAACGAAAT CGGCGTGGTG 
CAGGATATCG CGGCTATCGG CGAAATGTGC CGTGCTCGTG GCATTATCTA TCACGTTGAT 
GCAACCCAGA GCGTGGGTAA ACTGCCTATC GACCTGAGCC AGTTGAAAGT TGACCTGATG 
TCTTTCTCCG GTCACAAAAT CTATGGCCCG AAAGGTATCG GTGCGCTGTA TGTGCGTCGT 
AAACCGCGCG TACGCATCGA AGCGCAAATG CACGGCGGCG GTCACGAACG CGGTATGCGT 
TCCGGCACTC TGCCTGTTCA CCAGATCGTC GGCATGGGCG AAGCCTATCG CATCGCAAAA 
GAAGAGATGG CGACCGAGAT GGAACGTCTG CGCGGCCTGC GTAACCGTCT ATGGAACGGC 
ATCAAAGATA TCGAAGAAGT TTACCTGAAC GGTGACCTGG AACACGGTGC GCCGAACATT 
CTCAACGTCA GCTTCAACTA CGTTGAAGGT GAGTCGCTGA TTATGGCGCT GAAAGACCTC 
GCAGTTTCTT CAGGTTCCGC CTGTACGTCA GCAAGCCTCG AACCGTCCTA CGTGCTGCGC 
GCGCTGGGGC TGAACGACGA GCTGGCACAT AGCTCTATCC GTTTCTCTTT AGGTCGTTTT 
ACTACTGAAG AAGAGATCGA CTACACCATC GAGTTAGTTC GTAAATCCAT CGGTCGTCTG 
CGTGACCTTT CTCCGCTGTG GGAAATGTAC AAGCAGGGCG TGGATCTGAA CAGCATCGAA 
TGGGCTCATC ATTAA

Protein sequence

MKLPIYLDYS ATTPVDPRVA EKMMQFMTMD GTFGNPASRS HRFGWQAEEA VDIARNQIAD 
LVGADPREIV FTSGATESDN LAIKGAANFY QKKGKHIITS KTEHKAVLDT CRQLEREGFE 
VTYLAPQRNG IIDLKELEAA MRDDTILVSI MHVNNEIGVV QDIAAIGEMC RARGIIYHVD 
ATQSVGKLPI DLSQLKVDLM SFSGHKIYGP KGIGALYVRR KPRVRIEAQM HGGGHERGMR 
SGTLPVHQIV GMGEAYRIAK EEMATEMERL RGLRNRLWNG IKDIEEVYLN GDLEHGAPNI 
LNVSFNYVEG ESLIMALKDL AVSSGSACTS ASLEPSYVLR ALGLNDELAH SSIRFSLGRF 
TTEEEIDYTI ELVRKSIGRL RDLSPLWEMY KQGVDLNSIE WAHH