Gene SNSL254_A2378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2378
Symbol	mglC
ID	6486288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2295162
End bp	2296172
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	642737717
Product	beta-methylgalactoside transporter inner membrane component
Protein accession	YP_002041459
Protein GI	194446429
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4211] ABC-type glucose/galactose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.909919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGT TAAACAAGAA AAGCTTTTTG ACCTGGCTGA AAGAGGGCGG AATTTACGTC 
GTTCTTTTAG TGTTGCTGGC GATTATTATT TTCCAGGACC CGACTTTTTT AAGTTTGCTG 
AATTTAAGTA ATATTCTGAC GCAATCTTCG GTACGTATTA TTATCGCGCT GGGCGTGGCG 
GGACTCATCG TCACCCAGGG GACAGACCTG TCGGCGGGGC GTCAGGTAGG GCTGGCGGCG 
GTCGTGGCGG CAACATTACT GCAATCAATG GAAAACGCCA ACAAAGTGTT TCCGGAAATG 
GCGACCATGC CGATTGCTCT GGTCATCCTG ATTGTCTGCG CGATTGGCGC GGTGATTGGC 
CTGGTGAACG GCATCATCAT TGCTTACCTG AATGTGACGC CGTTTATTAC CACGCTTGGC 
ACGATGATTA TCGTTTATGG AATCAACTCC CTTTACTATG ACTTTGTCGG CGCTTCGCCC 
ATTTCCGGCT TTGACAGCGG CTTTTCCACC TTTGCGCAGG GCTTTGTGGC GATGGGCAGT 
TTCCGGCTCT CCTACATCAC CTTTTACGCC CTGATTGCGG TAGCGTTTGT CTGGGTGCTG 
TGGAATAAGA CCCGCTTTGG TAAAAACATT TTTGCTATTG GCGGCAACCC GGAAGCGGCA 
AAAGTTTCTG GCGTAAACGT GGCGCTGAAC CTGCTGATGA TTTATGCGCT CTCCGGCGTG 
TTTTATGCCT TCGGCGGCTT ACTGGAAGCA GGGCGTATTG GTTCTGCCAC CAACAACCTC 
GGCTTTATGT ATGAACTGGA TGCGATTGCC GCGTGCGTGG TCGGGGGCGT ATCGTTTAGC 
GGCGGAGTGG GTACGGTCTT CGGCGTGGTG ACCGGCGTTA TTATCTTTAC CGTCATCAAC 
TACGGCCTGA CCTATATCGG GGTAAACCCG TACTGGCAGT ACATTATCAA AGGCGGCATT 
ATCATTTTCG CCGTGGCGCT GGACTCGCTG AAATACGCGC GTAAGAAGTA G

Protein sequence

MSALNKKSFL TWLKEGGIYV VLLVLLAIII FQDPTFLSLL NLSNILTQSS VRIIIALGVA 
GLIVTQGTDL SAGRQVGLAA VVAATLLQSM ENANKVFPEM ATMPIALVIL IVCAIGAVIG 
LVNGIIIAYL NVTPFITTLG TMIIVYGINS LYYDFVGASP ISGFDSGFST FAQGFVAMGS 
FRLSYITFYA LIAVAFVWVL WNKTRFGKNI FAIGGNPEAA KVSGVNVALN LLMIYALSGV 
FYAFGGLLEA GRIGSATNNL GFMYELDAIA ACVVGGVSFS GGVGTVFGVV TGVIIFTVIN 
YGLTYIGVNP YWQYIIKGGI IIFAVALDSL KYARKK