Gene SeSA_A3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3147
Symbol	csdA
ID	6517884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3040232
End bp	3041437
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	60%
IMG OID	642748160
Product	cysteine sulfinate desulfinase
Protein accession	YP_002115937
Protein GI	194738385
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.148622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTT TTAATCCCAC GCAGTTTCGC GCGCAGTTTC CCGCGCTAGC CGATGCGGGT 
GTTTATCTCG ATAGCGCCGC CACGGCATTA AAGCCACAGG CAGTCATTGA CGCCACGCAC 
CAGTTTTATT GTTTGAGCGC CGGTAACGTT CATCGTAGCC AGTTTGCACA GGCGCAGCGC 
CTGACGGCGC AATATGAAGC GGCCAGAGCA AAAGCAGCGC GACTGTTAAA CGCGCCCGAT 
GAAAAAAGTA TCGTCTGGAC TCGCGGCACC ACCGAAGCGA TCAACATGGT GGCGCAGTGT 
TACGCCCGTC CTCGTCTGCG CCCCGGCGAT GAAATTATCG TTAGCGTCGC CGAGCATCAC 
GCCAACCTTG TGCCCTGGCT GATGGTGGCG CAACAAACCG GCGCGCAGGT CATAAAACTG 
CCGCTTAATG ACCGACGTCT TCCTGATGTT GAGCGTCTGC CGGAACTGAT CACGTCGCGC 
AGCCGGATTC TGGCGCTGGG GCAAATGTCG AACGTAACGG GCGGCTGCCC GGATCTCGCA 
AGCGCTATCA GCGCCGCTCA CGCGGCGGGA ATGGTAGTGA TGGTAGATGG CGCGCAAGGC 
GCGGTACACT TCCCGGCGGA TCTCCAGCAG CTTGATATCG ATTTTTATGC TTTTTCCGCT 
CACAAACTGT ATGGCCCGAC CGGTATCGGC GTGCTGTACG GTAAGCCGGA GCTTCTTGAG 
GCGATGTCGC CCTGGCTCGG CGGCGGCAAG ATGATCCGTG ACGTTAGCTT TGAAGGCTTC 
ACCACTCAAA GCGCTCCCTG GAAACTGGAA GCGGGGACGC CGAACGTCGC CGGGGTCATC 
GGCCTGAGCG CTGCGCTGGA ATGGCTGTCC GATATCGATA TTGCACAGGC CGAAAACTGG 
AGCCGCGGGC TGGCGACGCT GGCGGAAGAC GCACTGGCGA AACGTCCGGG CTTTCGTTCG 
TTCCGCTGCC AGGACTCCAG CCTGCTGGCC TTTGATTTTG TCGGCGTGCA CCACGGCGAT 
ATGGTGACGC TGCTGGCGGA ATACGGTATT GCGCTCCGGG CCGGGCAACA TTGCGCCCAG 
CCATTGCTGG CGGAACTTGG CGTCACAGGG ACTCTGCGCG CCTCTTTTGC GCCGTATAAT 
ACCCAACATG ATGTGGATGC GTTGGTTAAC GCCGTTGACC GCGCGCTGGA ACTGCTGGTG 
GATTAA

Protein sequence

MNAFNPTQFR AQFPALADAG VYLDSAATAL KPQAVIDATH QFYCLSAGNV HRSQFAQAQR 
LTAQYEAARA KAARLLNAPD EKSIVWTRGT TEAINMVAQC YARPRLRPGD EIIVSVAEHH 
ANLVPWLMVA QQTGAQVIKL PLNDRRLPDV ERLPELITSR SRILALGQMS NVTGGCPDLA 
SAISAAHAAG MVVMVDGAQG AVHFPADLQQ LDIDFYAFSA HKLYGPTGIG VLYGKPELLE 
AMSPWLGGGK MIRDVSFEGF TTQSAPWKLE AGTPNVAGVI GLSAALEWLS DIDIAQAENW 
SRGLATLAED ALAKRPGFRS FRCQDSSLLA FDFVGVHHGD MVTLLAEYGI ALRAGQHCAQ 
PLLAELGVTG TLRASFAPYN TQHDVDALVN AVDRALELLV D