Gene ECH74115_4075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4075
Symbol	csdA
ID	6971927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3770134
End bp	3771339
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	56%
IMG OID	643387833
Product	cysteine sulfinate desulfinase
Protein accession	YP_002272276
Protein GI	209397968
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.023337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTT TTAATCCCGC GCAGTTTCGC GCCCAGTTTC CCGCTCTACA GGATGCGGGC 
GTCTATCTCG ACAGCGCCGC GACCGCGCTT AAACCTGAAG CCGTGGTTGA AGCCACCCGA 
CAGTTTTACA GTCTGAGCGC CGGAAACGTC CATCGCAGCC AGTTTGCCGA AGCCCAACGC 
CTGACCGCGC GTTATGAAGC TGCACGAGAG AAAGTGGCGC AATTACTGAA TGCACCGGAT 
GATAAAACTA TCGTCTGGAC GCGCGGCACC ACTGAATCCA TCAACATGGT GGCACAATGC 
TATGCGCGTC CGCGTCTGCA ACCGGGCGAT GAGATTATTG TCAGCGTGGC AGAACACCAC 
GCCAACCTCG TCCCCTGGCT GATGGTCGCC CAACAAACTG GAGCCAAAGT GGTCAAATTG 
CCGCTTAATG CGCAGCGACT GCCAGATGTC GATTTGCTGC CGGAACTGAT TACTCCCCGT 
AGTCGGATTC TGGCGTTGGG TCAGATGTCG AACGTAACTG GCGGTTGCCC GGATCTGGCG 
CGAGCGATTA CCTTTGCTCA TTCAGCCGGG ATAGTGGTGA TAGTTGATGG TGCTCAGGGG 
GCGGTGCATT TCCCCGCGGA TGTTCAGCAA CTGGATATCG ATTTCTATGC TTTCTCTGGT 
CACAAACTGT ATGGCCCGAC GGGTATCGGC GTGCTGTATG GCAAATCAGA ACTGCTGGAA 
GCGATGTCGC CCTGGCTGGG CGGCGGCAAA ATGGTTCACG AAGTGAGTTT TGACGGCTTC 
ACGACTCAAT CTGCGCCGTG GAAACTGGAA GCAGGAACGC CAAATGTGGC TGGTGTCATA 
GGATTAAGCG CGGCGCTGGA ATGGCTGGCA GATTACGATA TCAACCAGGC CGAAAACTGG 
AGCCGTAGCT TAGCAACGCT GGCGGAAGAT GCGCTGGCGA AACGTCCAGG CTTTCGTTCA 
TTCCGCTGCC AGGATTCCAG CCTGCTGGCC TTTGATTTTG CTGGCGTTCA TCACAGCGAT 
ATGGTGACGC TGCTGGCGGA GTACGGTATT GCCTTGCGGG CCGGGCAACA TTGCGCTCAG 
CCGCTACTGG CAGAATTAGG CGTGACCGGC ACACTGCGCG CCTCTTTTGC GCCATATAAT 
ACAAAGAGTG ATGTGGATGC GCTGGTGAAT GCCGTTGACC GCGCGCTGGA ATTATTGGTG 
GATTAA

Protein sequence

MNVFNPAQFR AQFPALQDAG VYLDSAATAL KPEAVVEATR QFYSLSAGNV HRSQFAEAQR 
LTARYEAARE KVAQLLNAPD DKTIVWTRGT TESINMVAQC YARPRLQPGD EIIVSVAEHH 
ANLVPWLMVA QQTGAKVVKL PLNAQRLPDV DLLPELITPR SRILALGQMS NVTGGCPDLA 
RAITFAHSAG IVVIVDGAQG AVHFPADVQQ LDIDFYAFSG HKLYGPTGIG VLYGKSELLE 
AMSPWLGGGK MVHEVSFDGF TTQSAPWKLE AGTPNVAGVI GLSAALEWLA DYDINQAENW 
SRSLATLAED ALAKRPGFRS FRCQDSSLLA FDFAGVHHSD MVTLLAEYGI ALRAGQHCAQ 
PLLAELGVTG TLRASFAPYN TKSDVDALVN AVDRALELLV D