Gene SeSA_A3569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3569
Symbol
ID	6517051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3446303
End bp	3447307
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	642748555
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_002116325
Protein GI	194734390
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0584327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA TACGTCCATT AACAGAAGCC GATGTGACTG CGGAATCGGC TTTTTTTATG 
CAGCGCCGAC AGGTGCTAAA AGCATTAGGC ATCAGCGCGG CCGCCTTATC CTTACCCTCA 
ACGGCGCAGG CCGATCTCTT CAGTTGGTTT AAAGGCAACG ATCGTCCGAA AGCGCCTGCC 
GGTAAACCGC TTGAGTTTAG TCAGCCTGCC GCCTGGCGAA GCGATTTAGC GTTAACGCCG 
GAAGATAAGG TGACGGGCTA CAACAATTTC TATGAGTTTG GCCTTGATAA AGCCGACCCG 
GCGGCCAATG CCGGAAGTCT GAAAACCGAA CCGTGGACGT TGAAAATCAG CGGGGAAGTC 
GCGAAGCCAT TTACGCTGGA TTACGACGAT TTAACACATC GTTTTCCATT AGAAGAGCGT 
ATCTATCGAA TGCGCTGCGT CGAAGCGTGG TCCATGGTCG TGCCGTGGAT TGGTTTCCCT 
TTATATAAGC TACTCGCGCA GGCACAGCCC ACCAGCCACG CTAAATATGT GGCATTCGAA 
ACGCTATACG CGCCGGATGA TATGCCAGGA CAGAAAGATC GCTTTATTGG CGGCGGACTG 
AAATACCCTT ATGTCGAAGG GCTACGTCTG GACGAAGCCA TGCATCCGCT GACTCTGATG 
ACCGTTGGCG TCTATGGTAA GGCGTTACCC CCGCAAAACG GCGCGCCCAT TCGACTCATC 
GTTCCATGGA AGTATGGTTT CAAAGGTATT AAATCTGTTG TTAGCATTAA ACTCACCCGC 
GAACGTCCGC CAACCACCTG GAATTTGTCG GCTCCCAACG AATATGGTTT TTACGCCAAT 
GTGAACCCGC ATGTGGATCA TCCACGCTGG TCTCAGGCTA CCGAACGCTT TATTGGTTCA 
GGCGGTATCC TTGATGTGCA AAGGCAGCCG ACGCTGCTGT TTAACGGCTA CGCCAATGAA 
GTCGCTTCGC TGTATCGCGG TCTCAATTTG CGGGAGAATT TTTAA

Protein sequence

MKKIRPLTEA DVTAESAFFM QRRQVLKALG ISAAALSLPS TAQADLFSWF KGNDRPKAPA 
GKPLEFSQPA AWRSDLALTP EDKVTGYNNF YEFGLDKADP AANAGSLKTE PWTLKISGEV 
AKPFTLDYDD LTHRFPLEER IYRMRCVEAW SMVVPWIGFP LYKLLAQAQP TSHAKYVAFE 
TLYAPDDMPG QKDRFIGGGL KYPYVEGLRL DEAMHPLTLM TVGVYGKALP PQNGAPIRLI 
VPWKYGFKGI KSVVSIKLTR ERPPTTWNLS APNEYGFYAN VNPHVDHPRW SQATERFIGS 
GGILDVQRQP TLLFNGYANE VASLYRGLNL RENF