Gene SeHA_C2423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2423
Symbol	mglC
ID	6488543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2331526
End bp	2332536
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	51%
IMG OID	642742606
Product	beta-methylgalactoside transporter inner membrane component
Protein accession	YP_002046241
Protein GI	194448922
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4211] ABC-type glucose/galactose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	88
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGT TAAACAAGAA AAGCTTTTTG ACCTGGCTGA AAGAGGGCGG AATTTACGTC 
GTTCTTTTAG TGTTGCTGGC GATTATTATT TTCCAGGACC CGACTTTTTT AAGTTTGCTG 
AATTTAAGTA ATATTCTGAC GCAATCTTCG GTACGTATTA TTATCGCGCT GGGCGTGGCG 
GGACTCATCG TCACCCAGGG GACAGACCTG TCGGCGGGGC GTCAGGTAGG GCTGGCGGCG 
GTCGTAGCGG CAACATTACT GCAATCAATG GAAAACGCCA ATAAAGTGTT TCCGGAAATG 
GCGACCATGC CGATTGCGCT GGTCATCCTG ATTGTCTGCG CGATTGGCGC GGTGATTGGC 
CTGGTGAACG GTATCATCAT TGCTTACCTG AACGTGACGC CGTTTATTAC CACGCTTGGC 
ACGATGATTA TCGTTTATGG GATCAACTCC CTTTACTATG ACTTTGTCGG CGCTTCGCCC 
ATTTCCGGCT TTGACAGCGG CTTTTCCACC TTTGCGCAGG GCTTTGTGGC GATGGGCAGT 
TTCCGGCTCT CATACATCAC CTTTTACGCT CTGATTGCGG TAGCGTTTGT CTGGGTGCTG 
TGGAATAAGA CCCGTTTTGG TAAAAACATT TTTGCTATTG GCGGCAACCC GGAAGCGGCG 
AAAGTTTCCG GAGTAAACGT GGCGTTGAAC CTGCTGATGA TTTATGCGCT CTCCGGCGTG 
TTTTATGCCT TCGGCGGCTT ACTGGAAGCA GGGCGTATTG GTTCTGCCAC CAACAACCTC 
GGCTTTATGT ATGAACTGGA TGCGATTGCC GCATGCGTTG TCGGGGGCGT ATCGTTTAGC 
GGCGGAGTGG GGACGGTCTT CGGCGTGGTG ACCGGCGTCA TTATCTTTAC CGTCATCAAC 
TATGGCCTGA CCTATATCGG GGTAAACCCG TACTGGCAGT ACATTATCAA AGGCGGCATT 
ATCATTTTCG CCGTGGCGCT GGACTCGCTG AAATACGCGC GTAAGAAGTA G

Protein sequence

MSALNKKSFL TWLKEGGIYV VLLVLLAIII FQDPTFLSLL NLSNILTQSS VRIIIALGVA 
GLIVTQGTDL SAGRQVGLAA VVAATLLQSM ENANKVFPEM ATMPIALVIL IVCAIGAVIG 
LVNGIIIAYL NVTPFITTLG TMIIVYGINS LYYDFVGASP ISGFDSGFST FAQGFVAMGS 
FRLSYITFYA LIAVAFVWVL WNKTRFGKNI FAIGGNPEAA KVSGVNVALN LLMIYALSGV 
FYAFGGLLEA GRIGSATNNL GFMYELDAIA ACVVGGVSFS GGVGTVFGVV TGVIIFTVIN 
YGLTYIGVNP YWQYIIKGGI IIFAVALDSL KYARKK