Gene CPR_1343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1343
Symbol	mglC
ID	4205964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1515105
End bp	1516133
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	33%
IMG OID	642565897
Product	beta-methylgalactoside transporter inner membrane component
Protein accession	YP_698663
Protein GI	110803947
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4211] ABC-type glucose/galactose transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.854381
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCA AATCAAAGAA AAAGTTTAAT TTAAATAGCC AGTGGTTAAT GAATAATGCT 
ATATATATAG TTTTGGTAGT TTTATTAATA GGAATTTGTA TTATTTCACT AGACTTTTTA 
TCATTAAAAA ACTTTATTAA TATATTAAGC CAATCCTCTT CTCGTATAAT AATAGCCCTT 
GGGGTTGGAG GAATACTTTT AACTGAAGGT ACTGACCTTT CCGCTGGTAG AACAGTTGGA 
CTTGCTGCCG TAGTATCAGC TTCATTACTT CAAGCTGGTG ATTATGCATA TAAAATGTAT 
CCTAATTTAC CTGAATTGCC TATATTCATT CCTATTTTAA TAGCAATGGC TGTTTGTGGA 
ATCGTTGGTC TTGTAAATGG ACTAGTTGTT TCTAAATTTA ATGTTCCTCC ATTTATAGCT 
ACTCTAGGAA TGATGACAGG AATATATGGA CTTAACTCAA TATACTTTGA TAGACCTCCA 
TATGGAGCTA TGCCAATAGG TGGTCTTAGT CGATCCTTTA GCAATTTTAC ACTTGGATCA 
ATCCCCATAT ATGGAAATAT AAAAATACCT TATTTAGTTA TATATGCAAT TATTGTAATA 
GCTGTAATTT GGACTTTATG GAATAAAACT AAATTTGGTA AAAACCTTTA TGCTATAGGT 
GGTAACAGAG AAGCTGCTGT GGTTTCAGGT GTAAATGTTG TTAGAACACT TTTATTAGTT 
TATATGTTAG CTGGAGTTCT TTATGGTTTT GCAGGTGCCC TAGAAGCTGG TCGTGTTGGT 
AGTGCTACTG CTAGTACTGG TGAAATGTAT GAATTAGATG CCATAGCTTC CTGTGTTGTT 
GGTGGAGTTT CCACTGCTGG TGGTGTTGGT ACTGTTCCTG GAATAGTAAC TGGTGTTTTA 
ATATTCCAAG TTATAAACTA TGGCCTAGCT TTCATAGGTG TTAGCCCTTA TTTACAATTC 
GTTATAAAAG GTTTAATTAT AGTTCTAGCT GTAGCTCTTG ATATGAGAAA ATACATGAAA 
AAGAACTAA

Protein sequence

MQTKSKKKFN LNSQWLMNNA IYIVLVVLLI GICIISLDFL SLKNFINILS QSSSRIIIAL 
GVGGILLTEG TDLSAGRTVG LAAVVSASLL QAGDYAYKMY PNLPELPIFI PILIAMAVCG 
IVGLVNGLVV SKFNVPPFIA TLGMMTGIYG LNSIYFDRPP YGAMPIGGLS RSFSNFTLGS 
IPIYGNIKIP YLVIYAIIVI AVIWTLWNKT KFGKNLYAIG GNREAAVVSG VNVVRTLLLV 
YMLAGVLYGF AGALEAGRVG SATASTGEMY ELDAIASCVV GGVSTAGGVG TVPGIVTGVL 
IFQVINYGLA FIGVSPYLQF VIKGLIIVLA VALDMRKYMK KN