Gene SbBS512_E3060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3060
Symbol	csdA
ID	6271980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2858580
End bp	2859785
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	56%
IMG OID	641726990
Product	cysteine sulfinate desulfinase
Protein accession	YP_001881451
Protein GI	187730199
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000299944
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTT TTAATCCCGC GCAGTTTCGC GCCCAGTTTC CCGCACTACA GGATGCGGGC 
GTCTATCTCG ACAGCGCCGC GACCGCGCTT AAACCTGAAG CCGTGGTTGA AGCCACTCGA 
CAGTTTTACA GCCTGAGCGC CGGAAACGTC CATCGCAGCC AGTTTGCCGA AGCCCAACGC 
CTGACCGCGC GTTATGAAGC TGCACGAGAG AAAGTGGCGC AATTACTGAA TGCACCGGAT 
GATAAAACTA TCGTCTGGAC GCGCGGCACC ACTGAATCCA TCAACATGGT GGCACAATGC 
TATGCGCGTC CGCGTCTGCA ACCGGGCGAT GAGATTATTG TCAGCGTGGC AGAACACCAC 
GCCAACCTCG TCCCCTGGCT GATGGTCGCC CAACAAACTG GAGCCAAAGT GGTGAAATTG 
CCGCTTAATG CGCAGCGACT GCCGGATGTC GATTTGTTGC CAGAACTGAT TACTCCCCGT 
AGTCGGATTC TGGCGTTGAG TCAGATGTCG AACGTTACTG GCGGTTGCCC GGATCTGGCG 
CGAGCGATTA CCTTTGCTCA TTCAGCAGGG ATGGTGGTGA TGGTTGATGG TGCTCAGGGG 
GCGGTGCATT TCCCCGCGGA TGTTCAGCAA CTGGATATCG ATTTCTATGC TTTCTCTGGT 
CACAAACTGT ATGGCCCGAC GGGTATCGGC GTGCTGTATG GCAAATCAGA ACTGCTGGAA 
GCGATGTCGC CCTGGCTGGG TGGCGGCAAA ATGATTCACG AAGTGAGTTT TGACGGCTTC 
ACGACTCAAT CTGCGCCGTG GAAACTGGAA GCAGGAACGC CAAATGTGGC TGGTGTCATA 
GGATTAAGCG CGGCGCTGGA ATGGCTGGCA GATTACGATA TCAACCAGGC CGAAAACTGG 
AGCCATAGCT TAGCAACGCT GGCGGAAGAT GCGCTGGCGA AACGTCCAGG CTTTCGTTCA 
TTCCGCTGCC AGGATTCCAG CCTGCTGGCC TTTGATTTTG CTGGCGTTCA TCACAGCGAT 
ATGGTGACGC TACTGGCGGA GTACGGTATT GCCTTGCGGG CCGGGCAACA TTGCGCTCAG 
CCGCTACTGG CAGAATTAGG CGTAACCGGC ACACTGCGCG CCTCTTTTGC GCCATATAAT 
ACAAAGAGTG ATGTGGATGC GCTGGTGAAT GCCGTTGACC GCGCGCTGGA ATTATTGGTG 
GATTAA

Protein sequence

MNVFNPAQFR AQFPALQDAG VYLDSAATAL KPEAVVEATR QFYSLSAGNV HRSQFAEAQR 
LTARYEAARE KVAQLLNAPD DKTIVWTRGT TESINMVAQC YARPRLQPGD EIIVSVAEHH 
ANLVPWLMVA QQTGAKVVKL PLNAQRLPDV DLLPELITPR SRILALSQMS NVTGGCPDLA 
RAITFAHSAG MVVMVDGAQG AVHFPADVQQ LDIDFYAFSG HKLYGPTGIG VLYGKSELLE 
AMSPWLGGGK MIHEVSFDGF TTQSAPWKLE AGTPNVAGVI GLSAALEWLA DYDINQAENW 
SHSLATLAED ALAKRPGFRS FRCQDSSLLA FDFAGVHHSD MVTLLAEYGI ALRAGQHCAQ 
PLLAELGVTG TLRASFAPYN TKSDVDALVN AVDRALELLV D