Gene CPF_2647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2647
Symbol	malQ
ID	4201910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2915110
End bp	2916603
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	31%
IMG OID	638083513
Product	4-alpha-glucanotransferase
Protein accession	YP_697027
Protein GI	110801309
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGAG CAAGTGGAAT AATAATGCAT ATTGCTTCCT TACCTGGAAA GTATGGAATA 
GGTACTTTTG GTAAGGAAGC ATTTGAGTTT GTAGATTTTT TAAAGAAAGC TGGACAAGGA 
TGTTGGCAAA TATTGCCCTT AGGTCCTACA AGTTATGGTG ATTCACCATA TCAATCATTT 
TCAGCCTTTG CAGGAAATCC ATATTTTATA GATTTTGATA TTTTAAATAA AGAAGGATTA 
CTTGATAAAA AAGATTACCA AGGAATTAAT TTTGGAAATG ACCCAGAAAA AATAGATTAT 
GCTTTATTAT TTGACAAGAA GATGAGAGTG TTAAGAGTAG CATATGAAAA ATCTTTAGAT 
GAGAATAAAG AAGAAATTGA AAAGTTTAGA GAAGAAAATA AACTTTGGCT TGAAGATTAT 
GCTTTATATA TGGCAATCAA AAATGAAAAC GAATTAGTAA GTTGGCAAGA ATGGGATGAA 
AAATTAAGAT TAAGAGATAA AAAGACCTTA GAAGAATATA AAGTTAAATT AGAAAAAGAA 
ATAAACTACT GGGTATTCTT ACAATATCAT TTCTTTAAGC AATGGAATAA ATTAAAAGAG 
TATGCAAATA GTTTTGGAAT TAAGATAATT GGAGATATGC CTATATATGT TGCAGAGGAT 
AGTGCAGATG TTTGGGCAAA TCCAAAAGCA TTTTTATTAG ATGAAAATAA TATTCCTAAA 
AAGGTTGCTG GATGTCCACC AGATGCTTTT TCAGAAACAG GTCAATTATG GGGAAATCCT 
ATATATGATT GGAGCTACAT GGATGACACA GGATATTCTT GGTGGATTGA TAGAGTAAGA 
GAAAGCTTTA AGCTTTATGA CATATTAAGA ATAGATCACT TTAGAGGGTT TGAAGCTTAC 
TGGCAAATAC CATATGGAGA TGAAACTGCT GTAAATGGTG AGTGGGTTAA AGGCCCTGGA 
ATAAAATTAT TTAATGCAAT TAAAGAAGAG TTAGGTGAGG TTAATGTAAT AGCAGAAGAC 
CTTGGTTATT TAACTCAAGA GGTTATAGAT TTTAGAAATG AAACTGGATT CCCAGGAATG 
AAGGTTTTAC AATTTGCCTT TGATTCTAGA GAAGAAAGTG ATTATCTTCC ACATAATTAT 
CCAGTTAACT CAATAGCTTA TACAGGTACT CATGATAATG ATACATTTAG AGGTTGGTTT 
GAAGTTACAG GAAATAGAGA AGATGTGGAA TATTCTAAAA AATATTTAAA ACTTACTGAA 
GAGGAAGGGT ATAACTGGGG GTTTATCAGA GGAGTTTGGA GCAGTGTATC ACATACAGCT 
ATAGCTCTAA TGCAAGATTT CTTAAACTTA GGAAATGAGG CAAGAATAAA CTATCCATCT 
ACTCTTGGTG GCAATTGGCA ATGGAGAGTT AAATATGATG CTCTAACTGA TGAATTAGCA 
GAGAAAATAT ATGATATAAC AAAATTATAT GGAAGGGTGA ATATTAATGA ATAA

Protein sequence

MRRASGIIMH IASLPGKYGI GTFGKEAFEF VDFLKKAGQG CWQILPLGPT SYGDSPYQSF 
SAFAGNPYFI DFDILNKEGL LDKKDYQGIN FGNDPEKIDY ALLFDKKMRV LRVAYEKSLD 
ENKEEIEKFR EENKLWLEDY ALYMAIKNEN ELVSWQEWDE KLRLRDKKTL EEYKVKLEKE 
INYWVFLQYH FFKQWNKLKE YANSFGIKII GDMPIYVAED SADVWANPKA FLLDENNIPK 
KVAGCPPDAF SETGQLWGNP IYDWSYMDDT GYSWWIDRVR ESFKLYDILR IDHFRGFEAY 
WQIPYGDETA VNGEWVKGPG IKLFNAIKEE LGEVNVIAED LGYLTQEVID FRNETGFPGM 
KVLQFAFDSR EESDYLPHNY PVNSIAYTGT HDNDTFRGWF EVTGNREDVE YSKKYLKLTE 
EEGYNWGFIR GVWSSVSHTA IALMQDFLNL GNEARINYPS TLGGNWQWRV KYDALTDELA 
EKIYDITKLY GRVNINE