Gene SeD_A2535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2535
Symbol	mglC
ID	6871202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2414483
End bp	2415493
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	642785614
Product	beta-methylgalactoside transporter inner membrane component
Protein accession	YP_002216272
Protein GI	198242043
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4211] ABC-type glucose/galactose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.943275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGT TAAACAAGAA AAGCTTTTTG ACCTGGCTGA AAGAGGGCGG AATTTACGTC 
GTTCTTTTAG TGTTGCTGGC GATTATTATT TTCCAGGACC CGACTTTTTT AAGTTTGCTG 
AATTTAAGTA ATATTCTGAC GCAATCTTCG GTACGTATTA TTATCGCGCT GGGCGTGGCG 
GGACTCATCG TCACCCAGGG GACAGACCTG TCGGCGGGGC GTCAGGTAGG GCTGGCGGCG 
GTCGTGGCGG CAACATTACT GCAATCAATG GAAAACGCCA ACAAAGTGTT TCCGGAAATG 
GCGACCATGC CGATTGCGCT GGTCATCCTG ATTGTCTGCG CGATTGGCGC GGTGATTGGC 
CTGGTGAACG GCATCATCAT TGCTTACCTG AATGTGACGC CGTTTATTAC CACGCTTGGC 
ACGATGATTA TCGTTTATGG GATCAACTCC CTTTACTATG ACTTTGTCGG CGCTTCGCCC 
ATTTCCGGCT TTGACAGCGG CTTTTCCACC TTTGCGCAGG GCTTTGTGGC GATGGGCAGT 
TTCCGGCTCT CATACATCAC CTTTTACGCC CTGATTGCGG TAGCGTTTGT CTGGGTGCTG 
TGGAATAAGA CCCGTTTTGG TAAAAACATT TTTGCTATTG GCGGCAACCC GGAAGCGGCA 
AAAGTTTCTG GCGTAAACGT GGCGCTGAAC CTGCTGATGA TTTATGCGCT CTCCGGCGTG 
TTTTATGCCT TCGGCGGCTT ACTGGAAGCA GGGCGTATTG GTTCTGCCAC CAACAACCTC 
GGCTTTATGT ATGAACTGGA TGCGATTGCC GCGTGCGTGG TCGGGGGCGT ATCGTTTAGC 
GGCGGAGTGG GTACGGTCTT CGGCGTGGTG ACCGGCGTCA TTATCTTTAC CGTCATCAAC 
TACGGCCTGA CCTATATCGG GGTAAACCCG TACTGGCAGT ACATTATCAA AGGCGGCATT 
ATCATTTTCG CCGTGGCGCT GGACTCGCTG AAATACGCGC GTAAGAAGTA G

Protein sequence

MSALNKKSFL TWLKEGGIYV VLLVLLAIII FQDPTFLSLL NLSNILTQSS VRIIIALGVA 
GLIVTQGTDL SAGRQVGLAA VVAATLLQSM ENANKVFPEM ATMPIALVIL IVCAIGAVIG 
LVNGIIIAYL NVTPFITTLG TMIIVYGINS LYYDFVGASP ISGFDSGFST FAQGFVAMGS 
FRLSYITFYA LIAVAFVWVL WNKTRFGKNI FAIGGNPEAA KVSGVNVALN LLMIYALSGV 
FYAFGGLLEA GRIGSATNNL GFMYELDAIA ACVVGGVSFS GGVGTVFGVV TGVIIFTVIN 
YGLTYIGVNP YWQYIIKGGI IIFAVALDSL KYARKK