Gene ECH74115_4743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4743
Symbol	glgX
ID	6969241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4388226
End bp	4390199
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	54%
IMG OID	643388444
Product	glycogen debranching enzyme
Protein accession	YP_002272872
Protein GI	209397714
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1523] Type II secretory pathway, pullulanase PulA and related glycosidases
TIGRFAM ID	[TIGR02100] glycogen debranching enzyme GlgX

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAAC TCGCCATTGG CAAACCCGCT CCCCTCGGCG CGCATTACGA CGGTCAGGGC 
GTCAACTTCA CACTTTTCTC CGCTCATGCC GAGCGGGTAG AACTGTGTGT CTTTGACGCC 
AATGGCCAGG AACATCGCTA TGACTTGCCA GGGCACAGTG GCGACATTTG GCACGGTTAT 
CTGCCGGATG CGCGCCCGGG TTTGCGTTAT GGTTATCGCG TTCATGGCCC CTGGCAACCC 
GCCGAGGGGC ATCGCTTTAA CCCGGCGAAG TTGTTGATTG ATCCTTGCGC GCGGCAAATT 
GACGGGGAGT TTAAAGATAA CCCGCTGCTG CACGCCGGTC ATAATGAACC TGACTATCGC 
GACAACGCCG CCATTGCGCC GAAATGCGTA GTGGTGGTTG ATCACTATGA CTGGGAAGAT 
GATGCCCCGC CGCGCACGCC GTGGGGCAGC ACCATCATTT ATGAAGCCCA TGTTAAAGGA 
TTAACGTACC TGCACCCGGA GATCCCGGTC GAGATCCGTG GCACTTATAA AGCCCTCGGG 
CATCCGGTGA TGATCAACTA TTTGAAACAA TTGGGCATTA CCGCGCTGGA ACTGCTGCCA 
GTGGCGCAGT TTGCCAGTGA ACCACGTCTG CAACGCATGG GGCTAAGTAA CTACTGGGGT 
TACAACCCGG TGGCGATGTT TGCGCTGCAT CCGGCGTATG CCTGCTCGCC AGAAACGGCG 
CTGCATGAGT TTCGCGATGC AATCAAAGCA CTGCATAAAG CGGGTATCGA AGTCATTCTT 
GATATCGTGC TCAACCATAG TGCGGAACTG GACCTCGACG GCCCGTTATT CTCGCTGCGT 
GGGATCGACA ACCGTAGCTA TTATTGGATA AGAGAAGACG GCGATTATCA CAACTGGACC 
GGTTGTGGCA ACACGCTCAA TTTGAGTCAC CCGGCGGTGG TGGATTATGC CAGCGCCTGC 
CTGCGTTATT GGGTAGAAAC CTGCCACGTC GATGGTTTCC GCTTTGATCT GGCGGCAGTC 
ATGGGCCGTA CGCCAGAGTT CCGTCAGGAT GCGCCGTTGT TTACCGCTAT CCAGAACTGC 
CCGGTGCTCT CGCAGGTGAA GTTAATTGCT GAACCGTGGG ATATCGCTCC TGGTGGTTAT 
CAGGTGGGAA ATTTCCCGCC GCTGTTTGCC GAGTGGAACG ATCATTTCCG CGATGCTGCC 
CGTCGTTTCT GGCTACATTA TGATTTGCCT CTGGGGGCGT TTGCCGGGCG TTTTGCTGCC 
TCCAGCGATG TTTTTAAACG TAATGGTCGT CTGCCGAGTG CCGCGATTAA TCTCGTCACC 
GCGCATGACG GTTTTACGCT TCGCGACTGC GTTTGTTTCA ACCATAAACA CAATGAAGCA 
AACGGAGAAG AAAATCGCGA CGGGACCAAC AACAATTACA GTAACAATCA TGGTAAAGAA 
GGGGTAGGCG GTACCCTTGA CCTGGTTGAA CGGCGGCGCG ACAGCATTCA CGCCCTGTTA 
ACAACGTTGT TGCTCTCCCA GGGTACGCCG ATGTTACTGG CCGGTGACGA ACATGGTCAC 
AGCCAGCATG GCAATAACAA TGCCTACTGT CAGGATAACC AATTAACCTG GTTGGACTGG 
TCGCAGGCAA GCAGTGGTTT AACCGCATTT ACCGCCGCGT TAATCCATCT GCGCAAGCGT 
ATTCCCGCTT TGGTGGAGAA TCGCTGGTGG GAAGAAGGCG ACGGCAATGT CCGTTGGCTA 
AATCGATATG CTCAACCTTT AAGCACGGAT GAGTGGCAAA ACGGGCCGAA ACAGCTGCAA 
ATTCTGCTCT CGGATCGCTT TTTGATCGCA ATTAACGCCA CGCTTGAGGT AACAGAGATT 
GTTTTACCTG CTGGGGAGTG GCACGCCATT CCCCCATTCG CTGGAGAGGA TAACCCAGTG 
ATTACGGCTG TCTGGCAGGG ACCTGCACAC GGATTGTGTG TGTTCCAGAG ATGA

Protein sequence

MTQLAIGKPA PLGAHYDGQG VNFTLFSAHA ERVELCVFDA NGQEHRYDLP GHSGDIWHGY 
LPDARPGLRY GYRVHGPWQP AEGHRFNPAK LLIDPCARQI DGEFKDNPLL HAGHNEPDYR 
DNAAIAPKCV VVVDHYDWED DAPPRTPWGS TIIYEAHVKG LTYLHPEIPV EIRGTYKALG 
HPVMINYLKQ LGITALELLP VAQFASEPRL QRMGLSNYWG YNPVAMFALH PAYACSPETA 
LHEFRDAIKA LHKAGIEVIL DIVLNHSAEL DLDGPLFSLR GIDNRSYYWI REDGDYHNWT 
GCGNTLNLSH PAVVDYASAC LRYWVETCHV DGFRFDLAAV MGRTPEFRQD APLFTAIQNC 
PVLSQVKLIA EPWDIAPGGY QVGNFPPLFA EWNDHFRDAA RRFWLHYDLP LGAFAGRFAA 
SSDVFKRNGR LPSAAINLVT AHDGFTLRDC VCFNHKHNEA NGEENRDGTN NNYSNNHGKE 
GVGGTLDLVE RRRDSIHALL TTLLLSQGTP MLLAGDEHGH SQHGNNNAYC QDNQLTWLDW 
SQASSGLTAF TAALIHLRKR IPALVENRWW EEGDGNVRWL NRYAQPLSTD EWQNGPKQLQ 
ILLSDRFLIA INATLEVTEI VLPAGEWHAI PPFAGEDNPV ITAVWQGPAH GLCVFQR