Gene SeD_A4406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4406
Symbol
ID	6874828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4254187
End bp	4255569
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	53%
IMG OID	642787326
Product	inner membrane symporter YihP
Protein accession	YP_002217937
Protein GI	198246158
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0907861
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	88
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAA CATCATCGAA TCCGGCAACC CTACGCTTGC CGTTTAAAGA AAAACTTGCC 
TATGGACTGG GGGATTTAGG TTCTAATATC CTGTTAGATA TCGGAACCCT CTATTTACTC 
AAATTTTATA CCGATGTGCT GGGTTTACCA GGGACTTACG GCGGGATCAT TTTCCTGATC 
GCCAAATTTT TTACCGCATT TACCGATATG GGTACCGGCA TTATGCTCGA CTCGCGGCGT 
AAAATTGGTC CGAAGGGCAA ATTCCGCCCG TTCGTGCTTT ACGCGGCATT TCCGGTAACG 
CTACTGGCGA TTGCTAACTT TGTCGGCACA CCGTTTGAGG TGACGGGAAA AACCGTCGTC 
GCAACGATGC TGTTTATGCT GTACGGGCTG GTTTTCAGCA TGATGAACTG CTCGTATGGC 
GCGATGGTAC CCGCGATTAC CAAGAACCCG GATGAACGCG CCTCGCTTGC CGCCTGGCGT 
CAGGGCGGCG CCACTCTCGG CCTGCTGCTG TGTACCGTTG GCTTTGTGCC GGTCATGAAC 
CTGATCGAAG GCAATGCCCA ACTCAGCTAT ATTTTCGCCG CCACGCTATT TTCATTGTTT 
GGCCTGCTAT TTATGTGGCT GTGCTACGCC GGCGTTAAAG AGCGCTACGT TGAAGTGAAA 
CCTGTCGATA GCGCGCAAAA GCCTGGATTA TTGCAGTCGT TCCGCGCCAT CGCCGGTAAC 
CGTCCGCTGT TTATTCTGTG TATCGCCAAC CTTTGTACTC TCGGCGCCTT CAACGTCAAA 
CTGGCGATTC AGGTTTATTA CACCCAGTAC GTTCTTAACG ACCCGATCCT CCTCTCCTGG 
ATGGGCTTCT TTAGCATGGG CTGTATTTTT ATCGGCGTCT TTTTGATGCC CGGCGCAGTC 
AGGCGTTTTG GCAAGAAGAA AGTCTATATC GGCGGGCTGT TAATATGGGT GGCAGGCGAT 
CTGCTCAACT ACTTCTTTGG CGGCGGCTCG GTCAGTTTTG TCGCCTTCTC CTGCCTGGCG 
TTCTTCGGTT CCGCCTTCGT CAACAGCCTG AACTGGGCGC TGGTTTCCGA CACGGTGGAG 
TACGGTGAAT GGCGCACCGG CGTCCGCTCG GAAGGGACGG TTTACACCGG CTTCACGTTC 
TTCCGTAAGG TCTCCCAGGC GCTGGCAGGG TTCTTCCCCG GCTGGATGCT GACGCAAATC 
GGTTATATCC CGAATGTGGT GCAATCAGCA GGCACCGTCG AAGGCCTACG CCAGTTGATC 
TTTATTTATC CTTGCGTGCT GGCGGTCATC ACCATTATTG CGATGGGCTG TTTCTACAAC 
CTCAACGAGA AGATGTACGT GCGAATTGTG GAAGAGATTG AGGCCCGGAA ACATACGGTT 
TAA

Protein sequence

MSQTSSNPAT LRLPFKEKLA YGLGDLGSNI LLDIGTLYLL KFYTDVLGLP GTYGGIIFLI 
AKFFTAFTDM GTGIMLDSRR KIGPKGKFRP FVLYAAFPVT LLAIANFVGT PFEVTGKTVV 
ATMLFMLYGL VFSMMNCSYG AMVPAITKNP DERASLAAWR QGGATLGLLL CTVGFVPVMN 
LIEGNAQLSY IFAATLFSLF GLLFMWLCYA GVKERYVEVK PVDSAQKPGL LQSFRAIAGN 
RPLFILCIAN LCTLGAFNVK LAIQVYYTQY VLNDPILLSW MGFFSMGCIF IGVFLMPGAV 
RRFGKKKVYI GGLLIWVAGD LLNYFFGGGS VSFVAFSCLA FFGSAFVNSL NWALVSDTVE 
YGEWRTGVRS EGTVYTGFTF FRKVSQALAG FFPGWMLTQI GYIPNVVQSA GTVEGLRQLI 
FIYPCVLAVI TIIAMGCFYN LNEKMYVRIV EEIEARKHTV