Gene EcE24377A_3116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3116
Symbol	csdA
ID	5587381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3123414
End bp	3124619
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	55%
IMG OID	640926758
Product	cysteine sulfinate desulfinase
Protein accession	YP_001464134
Protein GI	157156888
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000009707
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTT TTAATCCCGC GCAGTTTCGC GCCCAGTTTC CCGCACTACT GGATGCGGGC 
GTCTATCTCG ATAGCGCCGC GACCGCGCTT AAACCTGAAG CCGTGGTTGA AGCCACTCGA 
CAGTTTTACA GCCTGAGCGC CGGAAACGTC CATCGCAGCC AGTTTGCCGA AGCCCAACGC 
CTGACCGCGC GTTATGAAGC TGCACGAGAG AAAGTGGCGC AATTACTGAA TGCACCGGAT 
GATAAAACTA TCGTCTGGAC GCGCGGCACC ACTGAATCCA TCAACATGGT GGCACAATGC 
TATGCGCGTC CGCGTCTGCA ACCGGGCGAT GAGATTATTG TCAGCGTGGC AGAACACCAC 
GCCAACCTCG TCCCCTGGCT GATGGTCGCC CAACAAACTG GAGCCAAAGT GGTGAAATTG 
CCGCTTAATG CGCAGCGACT GCCGGATGTC GATTTGTTGC CAGAACTGAT TACTCCCCGT 
AGTCGGATTC TAGCGTTGGG TCAGATGTCG AACGTTACTG GCGGTTGCCC GGATCTGGCG 
CGAGCGATTA CCTTTGCTCA TTCAGCCGGG ATGGTGGTGA TGGTTGATGG TGCTCAGGGG 
GCAGTGCATT TCCCCGCGGA TGTTCAGCAA CTGGATATTG ATTTCTATGC TTTTTCAGGT 
CACAAACTGT ATGGCCCGAC AGGTATCGGC GTGCTGTATG GTAAATCAGA ACTGCTGGAA 
GCGATGTCGC CCTGGCTGGG TGGCGGCAAA ATGATTCACG AAGTGAGTTT TGACGGTTTC 
ACCACTCAAT CTGCGCCGTG GAAACTGGAA GCAGGAACGC CAAATGTCGC TGGCGTCATA 
GGATTAAGCG CGGCGCTGGA ATGGCTGGCA GATTACGATA TCAACCAGGC CGAAAGCTGG 
AGCCGTAGCT TAGCAACGCT TGCAGAAGAA GCGCTGGCGA AACGTCCAGG CTTTCGTTCA 
TTCCGCTGCC AGGATTCCAG CCTGCTGGCC TTTGATTTTG CTGGCGTTCA TCATAGCGAT 
ATGGTGACGC TGCTGGCGGA GTACGGTATT GCCTTGCGGG CCGGGCAACA TTGCGCTCAG 
CCGCTACTGG CAGAATTAGG CGTAACCGGC ACACTGCGCG CCTCATTTGC GCCATATAAT 
ACAAAGAGTG ATGTGGATGC GCTGGTGAAT GCCGTTGACC GCGCGCTGGA ATTATTGGTG 
GATTAA

Protein sequence

MNVFNPAQFR AQFPALLDAG VYLDSAATAL KPEAVVEATR QFYSLSAGNV HRSQFAEAQR 
LTARYEAARE KVAQLLNAPD DKTIVWTRGT TESINMVAQC YARPRLQPGD EIIVSVAEHH 
ANLVPWLMVA QQTGAKVVKL PLNAQRLPDV DLLPELITPR SRILALGQMS NVTGGCPDLA 
RAITFAHSAG MVVMVDGAQG AVHFPADVQQ LDIDFYAFSG HKLYGPTGIG VLYGKSELLE 
AMSPWLGGGK MIHEVSFDGF TTQSAPWKLE AGTPNVAGVI GLSAALEWLA DYDINQAESW 
SRSLATLAEE ALAKRPGFRS FRCQDSSLLA FDFAGVHHSD MVTLLAEYGI ALRAGQHCAQ 
PLLAELGVTG TLRASFAPYN TKSDVDALVN AVDRALELLV D