Gene SNSL254_A3210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3210
Symbol	csdA
ID	6485697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3120294
End bp	3121499
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	60%
IMG OID	642738512
Product	cysteine sulfinate desulfinase
Protein accession	YP_002042236
Protein GI	194443337
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0520726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	86
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTT TTAATCCCAC GCAGTTTCGC GCGCAGTTTC CCGCGCTAGC CGATGCGGGT 
GTTTATCTCG ATAGCGCCGC CACGGCATTA AAGCCACAGG CAGTCATTGA CGCCACGCAC 
CAGTTTTATT ATTTGAGCGC CGGTAACGTT CATCGTAGCC AGTTTGCGCA GGCGCAGCGC 
CTGACGGCGC AATATGAAGC GGCCAGAGCA AAAGCAGCGC GACTGTTAAA CGCGCCCGAT 
GAAAAAAGTA TCGTCTGGAC ACGCGGCACC ACCGAAGCGA TCAACATGGT GGCGCAGTGT 
TACGCCCGTC CTCGTCTGCG CCCCGGCGAT GAAATTATCG TTAGCGTCGC CGAGCATCAC 
GCCAACCTTG TGCCCTGGCT GATGGTGGCG CAACAAACCG GCGCGCAGGT CATAAAACTG 
CCGCTTAATG ACCGGCGTCT TCCTGATGTT GAGCGTCTGC CGGAACTGAT CACGTCGCGC 
AGCCGCATTC TGGCGCTGGG GCAAATGTCG AACGTAACGG GCGGCTGCCC GGATCTCGCA 
AGCGCTATCA GCGCCGCTCA CGCAGCGGGA ATGGTCGTGA TGGTAGATGG CGCGCAAGGC 
GCGGTACACT TCCCGGCGGA TGTTCAGCAG CTTGATATCG ATTTTTATGC TTTTTCCGCT 
CACAAACTGT ATGGCCCGAC CGGTATCGGC GTGCTGTACG GTAAGCCGGA GCTTCTTGAG 
GCGATGTCGC CCTGGCTCGG CGGCGGCAAG ATGATCCGTG ACGTTAGCTT TGAAGGCTTC 
ACCACTCAAA GCGCTCCCTG GAAACTGGAA GCGGGGACGC CGAACGTCGC CGGGGTCATC 
GGCCTGAGCG CTGCGCTGGA ATGGCTGTCC GATATCGATA TTGAACAGGC CGAAAACTGG 
AGCCGCGGGC TGGCGACGCT GGCGGAAGAC GCACTGGCGA AACGCCCGGG CTTTCGTTCG 
TTCCGCTGCC AGGACTCCAG CCTGCTGGCC TTTGATTTTG TCGGCGTGCA CCACGGCGAT 
ATGGTGACGC TGCTGGCGGA ATACGGTATT GCGCTCCGGG CCGGGCAACA TTGCGCCCAG 
CCATTGCTGG CGGAACTTGG CGTCACAGGG ACTCTGCGCG CCTCTTTTGC GCCGTATAAT 
ACCCAACATG ATGTGGATGC GTTGGTTAAC GCCGTTGACC GCGCGCTGGA ACTGCTGGTG 
GATTAA

Protein sequence

MNAFNPTQFR AQFPALADAG VYLDSAATAL KPQAVIDATH QFYYLSAGNV HRSQFAQAQR 
LTAQYEAARA KAARLLNAPD EKSIVWTRGT TEAINMVAQC YARPRLRPGD EIIVSVAEHH 
ANLVPWLMVA QQTGAQVIKL PLNDRRLPDV ERLPELITSR SRILALGQMS NVTGGCPDLA 
SAISAAHAAG MVVMVDGAQG AVHFPADVQQ LDIDFYAFSA HKLYGPTGIG VLYGKPELLE 
AMSPWLGGGK MIRDVSFEGF TTQSAPWKLE AGTPNVAGVI GLSAALEWLS DIDIEQAENW 
SRGLATLAED ALAKRPGFRS FRCQDSSLLA FDFVGVHHGD MVTLLAEYGI ALRAGQHCAQ 
PLLAELGVTG TLRASFAPYN TQHDVDALVN AVDRALELLV D