Gene SeD_A1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1540
Symbol
ID	6873303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1488055
End bp	1489740
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	56%
IMG OID	642784692
Product	putative sulfate transporter YchM
Protein accession	YP_002215362
Protein GI	198244029
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0985805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.161381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAAAT TATTTTCCTC ACATGTGATG CCTTTCCGCG CTCTCATCGA TGCTTGCTGG 
AAAGAAAAAT ATACCGCCTC CCGGTTCACC CGCGATGTGA TAGCCGGGAT CACCGTCGGG 
ATTATTGCTA TCCCGCTGGC GATGGCGCTG GCAATTGGCA GTGGCGTTGC GCCGCAGTAT 
GGCCTCTATA CCTCCGCTGT CGCCGGGATC GTGATCGCGC TAACCGGCGG CTCGCGCTTT 
AGCGTTTCCG GCCCTACCGC CGCGTTTGTG GTGATTTTGT ATCCGGTATC GCAACAGTTT 
GGTCTGGCGG GCCTACTGGT CGCCACGCTG ATGTCGGGCT TCTTCCTGAT CCTTTTCGGC 
CTGGCGAGAC TGGGGCGATT GATTGAATAT ATCCCGGTGT CGGTCACGTT GGGTTTTACC 
TCAGGGATTG GTATTACCAT CGGTACCATG CAGATTAAAG ATTTTCTTGG TCTGCAGATG 
GCCCATGTGC CAGAGCACTA TTTGCAGAAA GTCGGCGCGC TGTTTATGGC GTTGCCCACC 
GTCAATATTG GCGATGCCGC CATTGGCGTG GTAACGCTGG GAACGTTGAT TTTCTGGCCG 
CGTCTCGGTA TTCGTCTGCC AGGACATCTT CCCGCGCTGC TGGCCGGTTG CGCCGTAATG 
GGGATTGTTA ATCTGCTGGG CGGCAATGTG GCGACTATCG GCTCACAGTT CCATTACGTT 
CTGGCTGACG GCACTCAGGG CAACGGCATC CCGCAGCTCC TGCCGCAACT GATGCTGCCG 
TGGAGTCTTC CTAGCTCCGA TTTCACGCTA AGCTGGGATT CACTGCGCGC GCTGCTGCCA 
GCGGCCTTCT CGATTGCAAT GCTGGGGGCA ATCGAATCAT TGCTCTGCGC CGTCGTGCTG 
GACGGCATGA CCGGCACCAA ACATAAAGCT AACAGCGAAC TTATCGGCCA GGGGCTGGGG 
AATATGGTCG CGCCGTTCTT TGGCGGCATC ACCGCCACCG CCGCGATTGC CCGCTCTGCC 
GCCAACGTCC GCGCTGGCGC GACCTCTCCC ATCTCGGCGG TAATTCACGC TATCCTGGTC 
ATTCTGGCGC TACTGGTCTT GGCCCCGCTA CTCTCCTGGC TGCCGCTTTC CGCGATGGCG 
GCGCTACTGC TGATGGTGGC ATGGAATATG AGTGAAGCCC ATAAAGTGGT GGATCTGTTA 
CGCCATGCGC CGAAAGACGA CATTATCGTT ATGCTGCTGT GCATGTCATT AACGGTTCTG 
TTTGATATGG TCATCGCCAT CAGCGTGGGG ATTGTCCTTG CTTCCCTGCT GTTTATGCGC 
CGTATTGCGC GAATGACTCG ACTTGCGCCG GTCAATGTTG ATGTACCTGA AGATGTGCTG 
GTGCTGCGTG TTATCGGTCC GCTCTTTTTC GCCGCGGCGG AAGGGCTGTT TACCGACCTT 
GAGTCACGTA TTAAGGGCAA ACGTATCGTC GTTCTGAAAT GGGACGCAGT ACCAGTGCTG 
GATGCAGGCG GGCTTGATGC TTTTCAGCGT TTTGTGAAGC GTCTGCCGGA GGGTTGCGAA 
TTGCGTATCA GTAATCTGGA GTTCCAACCG CTGCGCACAA TGGCGCGTGC CGGTATCAAA 
CCTATTCCTG GGCGTCTGAC CTTCTTCCCA AACAGGACGG AGGCGTTAGC GGATTTACTA 
AGTTAA

Protein sequence

MNKLFSSHVM PFRALIDACW KEKYTASRFT RDVIAGITVG IIAIPLAMAL AIGSGVAPQY 
GLYTSAVAGI VIALTGGSRF SVSGPTAAFV VILYPVSQQF GLAGLLVATL MSGFFLILFG 
LARLGRLIEY IPVSVTLGFT SGIGITIGTM QIKDFLGLQM AHVPEHYLQK VGALFMALPT 
VNIGDAAIGV VTLGTLIFWP RLGIRLPGHL PALLAGCAVM GIVNLLGGNV ATIGSQFHYV 
LADGTQGNGI PQLLPQLMLP WSLPSSDFTL SWDSLRALLP AAFSIAMLGA IESLLCAVVL 
DGMTGTKHKA NSELIGQGLG NMVAPFFGGI TATAAIARSA ANVRAGATSP ISAVIHAILV 
ILALLVLAPL LSWLPLSAMA ALLLMVAWNM SEAHKVVDLL RHAPKDDIIV MLLCMSLTVL 
FDMVIAISVG IVLASLLFMR RIARMTRLAP VNVDVPEDVL VLRVIGPLFF AAAEGLFTDL 
ESRIKGKRIV VLKWDAVPVL DAGGLDAFQR FVKRLPEGCE LRISNLEFQP LRTMARAGIK 
PIPGRLTFFP NRTEALADLL S