Gene EcolC_1951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1951
Symbol
ID	6068450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2156168
End bp	2157388
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	55%
IMG OID	641601363
Product	bifunctional cysteine desulfurase/selenocysteine lyase
Protein accession	YP_001724924
Protein GI	170019970
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00128399
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000107568
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACTTTTT CCGTCGACAA AGTGCGGGCC GACTTTCCGG TGCTTTCTCG TGAGGTAAAC 
GGTTTGCCGC TGGCTTATCT CGACAGCGCC GCCAGTGCGC AGAAACCGGG CCAGGTGATT 
GACACCGAGG CCGAGTTTTA TCGTCACGGC TACGCGGCGG TGCATCGCGG TATTCATACC 
TTAAGCGCCC AGGCGACCGA GAAAATGGAG AACGTACGCA AGCAGGCATC GTTGTTTATC 
AACGCCCGTT CGGCGGAAGA GCTGGTGTTC GTCCGCGGCA CGACGGAAGG GATCAATCTG 
GTCGCCAATA GCTGGGGCAA CAGCAACGTG CGGGCGGGCG ATAACATCAT CATAAGTCAG 
ATGGAGCACC ACGCTAACAT TGTTCCCTGG CAGATGCTTT GCGCACGCGT TGGCGCAGAG 
CTGCGTGTGA TCCCGCTCAA TCCCGACGGT ACGTTGCAAC TGGAGACGCT GCCTACGCTG 
TTTGATGAGA AAACTCGCCT GCTGGCAATT ACTCATGTCT CCAACGTGCT TGGCACAGAA 
AATCCACTGG CGGAAATGAT CACGCTTGCG CACCAGCATG GCGCAAAAGT GCTGGTGGAT 
GGCGCTCAGG CGGTGATGCA TCATCTGGTG GATGTTCAGG CGCTGGATTG CGACTTTTAC 
GTGTTCTCCG GGCATAAACT GTATGGCCCC ACCGGAATTG GCATTCTTTA TGTCAAAGAA 
GCCTTGTTGC AGGAGATGCC GCCGTGGGAA GGGGGCGGTT CTATGATCGC CACCGTCAGC 
CTGAGTGAAG GCACTACCTG GACCAAAGCA CCATGGCGGT TTGAAGCCGG TACACCCAAT 
ACCGGGGGCA TCATTGGTCT TGGCGCGGCG CTGGAGTATG TTTCGGCGCT GGGGCTTAAT 
AACATAGCCG AGTATGAACA GAATCTGATG CATTATGCGC TATCACAGCT GGAATCTGTA 
CCGGATCTCA CTCTCTATGG CCCACAAAAC AGGCTTGGCG TTATTGCTTT TAATCTCGGT 
AAACACCACG CCTATGATGT TGGCAGTTTT CTCGATAATT ACGGCATTGC TGTGCGTACC 
GGACATCACT GCGCAATGCC ATTGATGGCC TATTACAACG TCCCTGCGAT GTGTCGGGCG 
TCGCTGGCCA TGTATAACAC CCATGAAGAA GTGGATCGTC TGGTGACCGG CCTGCAACGT 
ATTCACCGTT TGCTGGGATA A

Protein sequence

MTFSVDKVRA DFPVLSREVN GLPLAYLDSA ASAQKPGQVI DTEAEFYRHG YAAVHRGIHT 
LSAQATEKME NVRKQASLFI NARSAEELVF VRGTTEGINL VANSWGNSNV RAGDNIIISQ 
MEHHANIVPW QMLCARVGAE LRVIPLNPDG TLQLETLPTL FDEKTRLLAI THVSNVLGTE 
NPLAEMITLA HQHGAKVLVD GAQAVMHHLV DVQALDCDFY VFSGHKLYGP TGIGILYVKE 
ALLQEMPPWE GGGSMIATVS LSEGTTWTKA PWRFEAGTPN TGGIIGLGAA LEYVSALGLN 
NIAEYEQNLM HYALSQLESV PDLTLYGPQN RLGVIAFNLG KHHAYDVGSF LDNYGIAVRT 
GHHCAMPLMA YYNVPAMCRA SLAMYNTHEE VDRLVTGLQR IHRLLG