Gene CPF_1549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1549
Symbol	mglA
ID	4202214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1767534
End bp	1769081
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	32%
IMG OID	638082427
Product	galactose/methyl galaxtoside transporter ATP-binding protein
Protein accession	YP_695992
Protein GI	110798692
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.178403
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGACT CTTCAAACCT GTTAGAAATG CGAAATATCT CTAAAGAATT CCCAGGGGTT 
AAAGCCTTAG ATAATGTAAC CTTAAAAGTA AAAAAAGGTT CTGTACATGC ATTAATGGGA 
GAAAATGGTG CTGGTAAATC AACCTTAATG AAATGTCTAT TTGGTATATA TCACCCTAAT 
TCAGGAGAAA TTTTTATTTC TGGCCAAAAG GTACAATTTA AAAATTCAAA ACACGCCCTA 
GATAATGGAG TATCTATGGT TCACCAAGAA CTAAATCAAG TTAGAGAAAG AAATGTTATG 
GATAATCTTT GGCTTGGTAG ATATCCTAAA AAAGGACTTT TTATAGATGA AAAGAAAATG 
TATGATGAAA CAGAAAAAAT CTTTAAAGAT CTAGATATAA ATGTTAATCC TCGTGATAAG 
GTTTCTACCC TATCTGTTTC TCAAATGCAA ATGGTTGAAA TAGCAAAGGC TGTTTCGTAT 
AACTCTAAAA TAATAGTAAT GGACGAGCCT ACTTCCTCTT TAACAGAAAA AGAAGTAAGT 
CATCTATTTA AAATAATAAA TAAACTTAGA AAGCAAGGAA TAAGTATAAT TTATATCTCT 
CATAAGATGG AAGAAATCTT AGAGATCTCT GATGAAGTTA CCATAATGAG AGATGGTAAA 
TGGATTGCTA CTGAAAAAGC TTCAGATCTT ACTATGGATT TAATAATAAA ACTTATGGTT 
GGACGTGAAC TTACTGATAG ATTCCCTAAA AAGGATCATA TTCCTAAAGA AACTATTTTA 
GAAGTAAATA ATCTTAGTGA TGCCAAAAAT GAATTAAAGA ATGTTTCCTT TAAACTTAGA 
AAGGGAGAAA TTTTAGGAAT TGCAGGTCTT GTTGGTGCTA AAAGAACTGA GACCTTAGAA 
ACCTTATTTG GCCTTAGAGA AAAGGGCTCT GGAGATATTA TTTTACATGG CAAAAAAGTT 
GATAACAGTA AGCCTTTTAA GGCTATGCAA AATGGTTTTG CCCTTGTTAC TGAAGAAAGA 
AGACAAACTG GAATCTTTGG AAAATTACCT ATAGATTTTA ATTCTATAAT AGCTAATATA 
GATAGTTATA AAACATCAAC CGGTCTTTTA GCAAATGGAA GAATCTCTAA AGATACTCAA 
TGGGTTATAG ATTCAATGAA AGTAAAAACT CCAAGTCAAA AAACTCTAAT CGGTAGCCTA 
TCTGGTGGTA ATCAACAAAA GATAGTAATT GGAAAATGGC TTCTTAGAAA ACCTGAAATA 
CTACTTCTAG ATGAGCCTAC TAGAGGTATA GATGTTGGTG CTAAATTCGA AATATACCAA 
CTTATAAATG AACTTGCTAA AGAAGACAAA GGAATAATTA TGGTTTCTTC TGAAATGCCT 
GAACTTTTAG GTGTATGTGA CAGAATACTA GTCATGAGTA ATGGTAGGGT TTCTGGCATA 
GTTAATGCTA ATGAGACTAC CCAAGAGGAA ATTATGCATC TATCTGCAAA ATATCTATCA 
GTAACAGGAG GAGTTAACAA TGCAAACCAA ATCAAAGAAA AAGTTTAA

Protein sequence

MKDSSNLLEM RNISKEFPGV KALDNVTLKV KKGSVHALMG ENGAGKSTLM KCLFGIYHPN 
SGEIFISGQK VQFKNSKHAL DNGVSMVHQE LNQVRERNVM DNLWLGRYPK KGLFIDEKKM 
YDETEKIFKD LDINVNPRDK VSTLSVSQMQ MVEIAKAVSY NSKIIVMDEP TSSLTEKEVS 
HLFKIINKLR KQGISIIYIS HKMEEILEIS DEVTIMRDGK WIATEKASDL TMDLIIKLMV 
GRELTDRFPK KDHIPKETIL EVNNLSDAKN ELKNVSFKLR KGEILGIAGL VGAKRTETLE 
TLFGLREKGS GDIILHGKKV DNSKPFKAMQ NGFALVTEER RQTGIFGKLP IDFNSIIANI 
DSYKTSTGLL ANGRISKDTQ WVIDSMKVKT PSQKTLIGSL SGGNQQKIVI GKWLLRKPEI 
LLLDEPTRGI DVGAKFEIYQ LINELAKEDK GIIMVSSEMP ELLGVCDRIL VMSNGRVSGI 
VNANETTQEE IMHLSAKYLS VTGGVNNANQ IKEKV