Gene SeAg_B4563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4563
Symbol
ID	6795232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	4465950
End bp	4467380
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	53%
IMG OID	642778649
Product	melibiose:sodium symporter
Protein accession	YP_002149215
Protein GI	197247890
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCT CTCTGACAAC AAAGCTGAGT TACGGGTTCG GTGCGTTTGG TAAGGATTTC 
GCCATCGGCA TTGTGTATAT GTACCTGATG TATTACTACA CCGATGTGGT GGGACTCTCG 
GTCGGCCTCG TCGGCACCCT CTTTCTGGTC GCGCGAATCT GGGATGCGAT AAACGATCCC 
ATCATGGGCT GGATTGTCAA CGCCACGCGT TCGCGGTGGG GGAAATTTAA GCCGTGGATA 
TTGATCGGCA CCTTAACCAA TTCGCTGGTG CTTTTCCTGC TGTTCAGCGC CCATCTTTTT 
GAGGGAACCG CGCAGGTTGT ATTTGTCTGC GTAACCTACA TCCTGTGGGG CATGACGTAT 
ACCATTATGG ATATCCCATT TTGGTCGCTG GTGCCGACCA TTACGCTTGA TAAGCGAGAA 
CGCGAACAAC TGGTGCCGTT CCCGCGTTTC TTCGCCAGCC TGGCTGGCTT CGTCACTGCC 
GGTATAACGC TGCCGTTTGT GAACTACGTT GGCGGAGCGG ATCGTGGGTT CGGCTTTCAG 
ATGTTTACGC TGGTACTGAT TGCGTTTTTT ATCGCCTCGA CTATCGTGAC ATTACGCAAC 
GTCCATGAGG TGTACTCCTC CGACAACGGT GTAACGGCGG GCCGCCCACA TCTGACGTTA 
AAAACGATCG TTGGATTGAT ATACAAAAAC GATCAGCTCT CTTGCCTGTT GGGAATGGCG 
CTGGCGTATA ACATTGCCTC TAATATTATC AATGGCTTTG CGATCTACTA CTTCACCTAT 
GTGATTGGCG ATGCCGATCT TTTTCCCTAT TACCTTTCTT ACGCCGGCGC GGCGAATCTG 
CTGACGCTGA TTGTCTTCCC CCGGCTGGTG AAAATGTTAT CGCGACGGAT ATTGTGGGCG 
GGCGCCTCCG TGATGCCCGT TCTGAGTTGC GCAGGGCTCT TCGCGATGGC GTTGGCGGAT 
GTCCATAATG CCGCTTTAAT CGTGGCGGCG GGTATTTTCC TGAATATCGG GACCGCGCTC 
TTTTGGGTGC TTCAGGTGAT CATGGTGGCG GATACGGTCG ATTATGGGGA ATTTAAGCTC 
AATATTCGCT GCGAGAGTAT CGCTTATTCC GTACAGACGA TGGTTGTGAA GGGCGGCTCG 
GCGTTTGCGG CGTTCTTTAT CGCTCTGGTG CTGGGGCTGA TTGGCTACAC GCCGAACGTG 
GCGCAGTCTG CGCAAACCCT GCAGGGGATG CAGTTTATTA TGATTGTCCT GCCGGTACTG 
TTTTTCATGA TGACGTTGGT TCTCTACTTC CGCTACTACC GTTTGAACGG CGACATGCTG 
CGCAAGATTC AGATCCACCT GCTGGATAAA TACCGGAAAA CGCCGCCATT CGTCGAACAG 
CCGGATAGCC CGGCGATTTC TGTGGTAGCG ACCAGCGATG TAAAAGCGTG A

Protein sequence

MSISLTTKLS YGFGAFGKDF AIGIVYMYLM YYYTDVVGLS VGLVGTLFLV ARIWDAINDP 
IMGWIVNATR SRWGKFKPWI LIGTLTNSLV LFLLFSAHLF EGTAQVVFVC VTYILWGMTY 
TIMDIPFWSL VPTITLDKRE REQLVPFPRF FASLAGFVTA GITLPFVNYV GGADRGFGFQ 
MFTLVLIAFF IASTIVTLRN VHEVYSSDNG VTAGRPHLTL KTIVGLIYKN DQLSCLLGMA 
LAYNIASNII NGFAIYYFTY VIGDADLFPY YLSYAGAANL LTLIVFPRLV KMLSRRILWA 
GASVMPVLSC AGLFAMALAD VHNAALIVAA GIFLNIGTAL FWVLQVIMVA DTVDYGEFKL 
NIRCESIAYS VQTMVVKGGS AFAAFFIALV LGLIGYTPNV AQSAQTLQGM QFIMIVLPVL 
FFMMTLVLYF RYYRLNGDML RKIQIHLLDK YRKTPPFVEQ PDSPAISVVA TSDVKA