Gene SeD_A3900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3900
Symbol
ID	6875110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3733693
End bp	3735027
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	54%
IMG OID	642786860
Product	major facilitator superfamily MFS_1
Protein accession	YP_002217488
Protein GI	198244952
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.416802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.649925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGCA TTGAAATAGA GAAACCGACC ACACGAGGGC GCTGGCTGCA TATTATTCCA 
GCCACGATCC TCGTTTATAT CGTGGCCTAT ATGGACAGGA CCAATACCGC CATTGGGATC 
GCAGGCGGCA TGGATGAAGA TTTAGGCATG ACGGCTTCTT TTGCCGGTCT GGTCGCCGGG 
ATCTTCTTTA TTGGTTATAT CTTCCTGCAA ATTCCCGGCG GTCAGATAGC CGAGCGGCTA 
AGCGCCAAAA AGTTAATTGC CTGGACAATC GTCGCCTGGG GGGGCTTTGC CCTGCTGACC 
GGTTTTGTTC AGACACCGAC GCAGTTGTTG ATTATCCGCT TTGTGCTCGG CGTGGCGGAA 
GGTGCTGTGT ATCCCGCCAT TCTGGCGCTG ATTGGCCACT GGTTCCCAAA TGAGGAGCGC 
GCCAGGGCTA TCGCCTATTT CCAGATGAAC CTGGCCGTCG CTTCTATTAT TACCGGGCCG 
CTTTCCGGCT GGCTTATTGA AACCTACGGC TGGCGGGAGA TGTTTATCAT CGAAGGCTTG 
CTCTCTCTGG GACTGCTCTT TGTCTGGCTA CCTTTGGTTT CCGATCACCC GCATCAGGCA 
AAGTGGCTGG ATCCGAAAGA GCGCGCCTGG ATCGAACAAA AATTGCTGGC CGATCGCGCG 
TTGAGTATTG GCGGAGAGCA AAGCAGCATT CGCGGCGTAT TAAAAAGCAT CAACCTGTGG 
AAGCTTGTCG GTATCTATTT CTTCGTACAG GTCGGCTTCT ATGGCTTCGC GCTATGGATG 
CCAAATCTGA TTAAACACCT GACCGGCAGC GGCATGACCA TCGTTGGGGT ACTCACTGCG 
GCGCCTTACG TTCTGTGCAT TATCGGTCAG TATTACATCG CCAAATGGTG TGATAAGACG 
ATGAATCGCC GCCTTTACAC GGCTATTCCT CTGCTGGGTT TCGCGGTCTG CCTCGCCCTC 
TCCTTATTAC TGAAAGATAA CGTCTGGCTC GCCTACGGCA TGATGGTTAT TTGCGGGTTC 
TTCCTGCAAG CCTATGCCGG TCCATTCTGG ACGCTGCCGC CATTACTCTT CGCCCCCAAC 
GTTCTGGGCG GCGTGCGCGG CACGATCAAC GCCCTGGGCA ACATTGGCGG CTTTATCGGT 
CCGTACCTCG TCGGGCTGTT AACGGTGACG TTCTCGCAAA CAGCAGGAAT GACCGTACTG 
GTTGCCGCCC TGCTTATCGC CGTTGGACTG CTTTTCAGCT TACCTTCTGT TACCGCTCGT 
CCTGCAGGTA GCAGTAACAC ACCTAACACC TCGACGCCGG GTGCGTCACT TAAACAGGAA 
GGAATCGCCA AATGA

Protein sequence

MMSIEIEKPT TRGRWLHIIP ATILVYIVAY MDRTNTAIGI AGGMDEDLGM TASFAGLVAG 
IFFIGYIFLQ IPGGQIAERL SAKKLIAWTI VAWGGFALLT GFVQTPTQLL IIRFVLGVAE 
GAVYPAILAL IGHWFPNEER ARAIAYFQMN LAVASIITGP LSGWLIETYG WREMFIIEGL 
LSLGLLFVWL PLVSDHPHQA KWLDPKERAW IEQKLLADRA LSIGGEQSSI RGVLKSINLW 
KLVGIYFFVQ VGFYGFALWM PNLIKHLTGS GMTIVGVLTA APYVLCIIGQ YYIAKWCDKT 
MNRRLYTAIP LLGFAVCLAL SLLLKDNVWL AYGMMVICGF FLQAYAGPFW TLPPLLFAPN 
VLGGVRGTIN ALGNIGGFIG PYLVGLLTVT FSQTAGMTVL VAALLIAVGL LFSLPSVTAR 
PAGSSNTPNT STPGASLKQE GIAK