Gene SeD_A4694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4694
Symbol
ID	6873344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4558585
End bp	4560015
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	53%
IMG OID	642787592
Product	melibiose:sodium symporter
Protein accession	YP_002218190
Protein GI	198241954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.772252
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCT CTCTGACAAC AAAGCTGAGT TACGGGTTCG GTGCGTTTGG TAAGGATTTC 
GCCATCGGCA TTGTGTATAT GTACCTGATG TATTACTACA CCGATGTGGT GGGACTTTCG 
GTCGGCCTCG TCGGCACCCT CTTTCTGGTC GCGCGAATCT GGGATGCGAT AAACGATCCC 
ATCATGGGCT GGATTGTCAA CGCCACGCGT TCGCGGTGGG GGAAATTTAA GCCGTGGATA 
TTGATCGGCA CCTTAACCAA TTCGCTGGTG CTTTTCCTGC TGTTCAGCGC CCATCTTTTT 
GAGGGAACCG CGCAGGTTGT ATTTGTCTGC GTAACCTACA TCCTGTGGGG CATGACGTAT 
ACCATTATGG ATATCCCATT TTGGTCGCTG GTGCCGACCA TTACGCTTGA TAAGCGAGAA 
CGCGAACAAC TGGTGCCGTT CCCGCGTTTC TTCGCCAGTC TGGCTGGCTT CGTCACTGCC 
GGTATAACGC TGCCGTTTGT GAACTACGTT GGTGGAGCGG ATCGTGGGTT CGGCTTTCAG 
ATGTTTACGC TGGTACTGAT TGCGTTTTTT ATCGCCTCGA CTATCGTGAC ATTACGCAAC 
GTACATGAGG TGTACTCCTC CGACAACGGT GTAACGGCGG GCCGCCCACA TCTGACGTTA 
AAAACGATCG TTGGATTGAT ATACAAAAAC GATCAGCTCT CTTGCCTGTT GGGAATGGCG 
CTGGCGTATA ACATTGCCTC CAATATTATC AATGGCTTTG CGATCTACTA CTTCACCTAT 
GTGATTGGCG ATGCCGATCT TTTTCCCTAT TACCTTTCTT ACGCCGGCGC GGCGAATCTG 
CTGACGCTGA TTGTCTTCCC CCGGCTGGTG AAAATGTTAT CGCGGCGGAT ATTGTGGGCG 
GGCGCCTCCG TGATGCCCGT TCTGAGTTGC GCAGGGCTCT TCGCGATGGC GTTGGCGGAT 
GTCCATAATG CCGCTTTAAT CGTGGCGGCG GGTATTTTCC TGAATATCGG GACCGCGCTC 
TTTTGGGTGC TTCAGGTGAT CATGGTGGCG GATACGGTCG ATTATGGGGA ATTTAAGCTC 
AATATTCGCT GCGAGAGTAT CGCTTATTCC GTACAGACGA TGGTCGTGAA GGGCGGCTCG 
GCGTTTGCGG CGTTCTTTAT CGCTTTGGTG CTGGGGCTGA TTGGCTACAC GCCGAACGTG 
GCGCAGTCTG CGCAAACCCT GCAGGGGATG CAGTTTATTA TGATTGTCCT GCCGGTACTG 
TTTTTCATGA TGACGTTGGT TCTCTACTTC CGCTACTACC GTTTGAACGG CGATATGCTG 
CGCAAGATTC AGATCCACCT GCTGGATAAA TACCGGAAAA CGCCGCCATT CGTCGAACAG 
CCGGATAGCC CGGCGATTTC TGTGGTAGCG ACCAGCGATG TAAAAGCGTG A

Protein sequence

MSISLTTKLS YGFGAFGKDF AIGIVYMYLM YYYTDVVGLS VGLVGTLFLV ARIWDAINDP 
IMGWIVNATR SRWGKFKPWI LIGTLTNSLV LFLLFSAHLF EGTAQVVFVC VTYILWGMTY 
TIMDIPFWSL VPTITLDKRE REQLVPFPRF FASLAGFVTA GITLPFVNYV GGADRGFGFQ 
MFTLVLIAFF IASTIVTLRN VHEVYSSDNG VTAGRPHLTL KTIVGLIYKN DQLSCLLGMA 
LAYNIASNII NGFAIYYFTY VIGDADLFPY YLSYAGAANL LTLIVFPRLV KMLSRRILWA 
GASVMPVLSC AGLFAMALAD VHNAALIVAA GIFLNIGTAL FWVLQVIMVA DTVDYGEFKL 
NIRCESIAYS VQTMVVKGGS AFAAFFIALV LGLIGYTPNV AQSAQTLQGM QFIMIVLPVL 
FFMMTLVLYF RYYRLNGDML RKIQIHLLDK YRKTPPFVEQ PDSPAISVVA TSDVKA