Gene EcHS_A1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1761
Symbol	sufS
ID	5591454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1781327
End bp	1782547
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	55%
IMG OID	640920909
Product	bifunctional cysteine desulfurase/selenocysteine lyase
Protein accession	YP_001458463
Protein GI	157161145
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.00014755
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTTTT CCGTCGACAA AGTGCGGGCC GACTTTCCGG TGCTTTCTCG TGAGGTAAAC 
GGTTTGCCGC TGGCTTATCT CGACAGCGCC GCCAGTGCGC AGAAACCGGG CCAGGTGATT 
GACGCCGAGG CCGAGTTTTA TCGTCACGGC TACGCGGCGG TGCATCGCGG TATTCATACC 
TTAAGCGCCC AGGCGACCGA GAAAATGGAG AACGTACGCA AGCAGGCATC GTTGTTTATC 
AACGCCCGTT CGGCGGAAGA GCTGGTGTTC GTCCGCGGCA CGACGGAAGG GATCAATCTG 
GTCGCCAATA GCTGGGGCAA CAGCAACGTG CGGGCGGGCG ATAACATCAT CATAAGTCAG 
ATGGAGCACC ACGCTAACAT TGTTCCCTGG CAGATGCTTT GCGCACGCGT TGGCGCAGAG 
CTGCGTGTGA TCCCGCTCAA TCCCGACGGT ACGTTGCAAC TGGAGACGCT GCCTACGCTG 
TTTGATGAGA AAACTCGCCT GCTGGCAATT ACTCATGTCT CCAACGTGCT TGGCACAGAA 
AATCCACTGG CGGAAATGAT CACGCTTGCG CACCAGCATG GCGCAAAAGT GCTGGTGGAT 
GGCGCTCAGG CGGTGATGCA TCATCTGGTG GATGTTCAGG CGCTGGATTG CGACTTTTAC 
GTGTTCTCCG GGCATAAACT GTATGGCCCC ACCGGAATTG GCATTCTTTA TGTCAAAGAA 
GCCTTGTTGC AGGAGATGCC GCCGTGGGAA GGGGGCGGTT CTATGATCGC CACCGTCAGC 
CTGAGTGAAG GCACTACCTG GACCAAAGCA CCATGGCGGT TTGAAGCCGG TACACCCAAT 
ACCGGGGGCA TCATTGGTCT TGGCGCGGCG CTGGAGTATG TTTCGGCGCT GGGGCTTAAT 
AACATAGCCG AGTATGAACA GAATCTGATG CATTATGCGC TATCACAGCT GGAATCTGTA 
CCGGATCTCA CTCTCTATGG CCCACAAAAC AGGCTTGGCG TTATTGCTTT TAATCTCGGT 
AAACACCACG CCTATGATGT TGGCAGTTTT CTCGATAATT ACGGCATTGC TGTGCGTACC 
GGACATCACT GCGCAATGCC ATTGATGGCC TATTACAACG TCCCTGCGAT GTGTCGGGCG 
TCGCTGGCCA TGTATAACAC CCATGAAGAA GTGGATCGTC TGGTGACCGG CCTGCAACGT 
ATTCACCGTT TGCTGGGATA A

Protein sequence

MTFSVDKVRA DFPVLSREVN GLPLAYLDSA ASAQKPGQVI DAEAEFYRHG YAAVHRGIHT 
LSAQATEKME NVRKQASLFI NARSAEELVF VRGTTEGINL VANSWGNSNV RAGDNIIISQ 
MEHHANIVPW QMLCARVGAE LRVIPLNPDG TLQLETLPTL FDEKTRLLAI THVSNVLGTE 
NPLAEMITLA HQHGAKVLVD GAQAVMHHLV DVQALDCDFY VFSGHKLYGP TGIGILYVKE 
ALLQEMPPWE GGGSMIATVS LSEGTTWTKA PWRFEAGTPN TGGIIGLGAA LEYVSALGLN 
NIAEYEQNLM HYALSQLESV PDLTLYGPQN RLGVIAFNLG KHHAYDVGSF LDNYGIAVRT 
GHHCAMPLMA YYNVPAMCRA SLAMYNTHEE VDRLVTGLQR IHRLLG