Gene YpsIP31758_0998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0998
Symbol	csdA
ID	5384973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	1199043
End bp	1200248
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	47%
IMG OID	640863968
Product	cysteine sulfinate desulfinase
Protein accession	YP_001399982
Protein GI	153950116
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.000110695
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTT TTAATCCAAT GGATTTTCGT CGGGAATTCC CTGCGCTCAG TGATAAATTA 
ACCTATCTGG ACAGTGCGGC GACCGCCTTG AAACCACGTG CAATGATTGA CGCGACACAG 
CAATTTTATC AGCAGGATTC AGCAACGGTA CACCGCAGCC AACATCAATC GGCGCTGTCA 
TTAACGGTTC GCTTTGAAAA CACCCGCCAA CAAGTGGCTG ATTTTATTAA CTCATCTACA 
GCAGAAAATA TTATCTGGAC GCGAGGAACA ACTGAAGCCA TCAATCTGAT CGCGCAAAGT 
TATGCCCGCC CCCGTTTACA ACCTGAAGAT GAAATTATTG TCAGCGAAGC TGAACATCAT 
GCGAATTTAA TTCCCTGGTT GATGGTAGCG GAGCAGACCG GTGCAAAAAT AGTCAAATTA 
CCTCTTGGCC TTGATCATCT GCCAGATTTA CAGCAACTCC CTCAACTACT TAATGAAAAA 
ACACGCATAT TAGCGCTGGG GCAGATGTCT AACGTAACAG GCGGTAGCCC TGATCTGGCT 
CAGGCTATTA GGCTGGCTCA CCAATATGAC TGTGTTGTCG TGGTTGACGG TGCTCAGGGG 
ATTGTTCATT GCCCAGCCGA TGTTCAGGCA TTGGATATTG ATTTTTATGC ATTCTCTTCC 
CATAAATTGT ATGGCCCAAC CGGCATTGGC GTGCTGTATG GGAAGACTGA ATTATTAGAA 
GAGATGCCCG CCTGGCAAGG CGGCGGTAAA ATGCTTACCC ATGTATCATT CGGGGGCTTT 
ACACCTCATG AAGTGCCTTA TCGCTTTGAA GCGGGTACAC CCAATATTGC TGGCGTTATT 
GGTTTATCAG CGGTACTCAA ATGGCTGGAA CATATTGATC TGGAAGAGGC CGAAGTTTAT 
AGCCAAGGTT TAGCTACAAT GGCAGAAAAT AAGCTCGCAC AATTACCGGG TTTTCACAGT 
TACCGTTGCC AGCAATCCAG TTTATTAGCA TTTACTTTCG ATGGTGTTCA TCACAGTGAT 
TTAGTGGCGT TATTGGCCGA GCAAGGTATC GCACTACGTG CTGGGCAACA CTGCGCACAG 
CCACTGATGG CCGCTCTGGG AGTCAATGGC AGTCTACGGG CTTCTTTTGC GCCTTATAAT 
ACCCCCCAAG ATGTTGAAAT GCTTTGCTCG GCGCTTGGTA AGGCATTGGA ACTGCTTCAA 
GACTAA

Protein sequence

MKVFNPMDFR REFPALSDKL TYLDSAATAL KPRAMIDATQ QFYQQDSATV HRSQHQSALS 
LTVRFENTRQ QVADFINSST AENIIWTRGT TEAINLIAQS YARPRLQPED EIIVSEAEHH 
ANLIPWLMVA EQTGAKIVKL PLGLDHLPDL QQLPQLLNEK TRILALGQMS NVTGGSPDLA 
QAIRLAHQYD CVVVVDGAQG IVHCPADVQA LDIDFYAFSS HKLYGPTGIG VLYGKTELLE 
EMPAWQGGGK MLTHVSFGGF TPHEVPYRFE AGTPNIAGVI GLSAVLKWLE HIDLEEAEVY 
SQGLATMAEN KLAQLPGFHS YRCQQSSLLA FTFDGVHHSD LVALLAEQGI ALRAGQHCAQ 
PLMAALGVNG SLRASFAPYN TPQDVEMLCS ALGKALELLQ D