Gene EcSMS35_3713 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3713
Symbol	glgX
ID	6146321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3779732
End bp	3781705
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	54%
IMG OID	641618539
Product	glycogen debranching enzyme
Protein accession	YP_001745679
Protein GI	170679803
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1523] Type II secretory pathway, pullulanase PulA and related glycosidases
TIGRFAM ID	[TIGR02100] glycogen debranching enzyme GlgX

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.723997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.535779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAAC TCGCCATTGG CAAACCCACT CCCCTCGGCG CGCATTACGA CGGTCAGGGC 
GTCAATTTCA CACTTTTCTC CGCTCATGCC GAGCGGGTAG AGCTGTGTGT CTTTGACGCC 
AATGGCCAGG AACATCGCTA TGACTTGCCA GGGCACAGTG GCGACATTTG GCACGGTTAT 
CTGCCGGATG CGCGTCCGGG TTTGCGTTAT GGTTATCGCG TTCATGGCCC CTGGCAACCC 
GCCGAGGGGC ATCGCTTTAA CCCGGCGAAG TTGTTGATTG ATCCTTGCGC GCGGCAAATT 
GACGGGGAGT TTAAAGATAA CCCGCTGCTA CACGCCGGTC ATAATGAACC TGACTATCGC 
GACAACGCCG CCATTGCGCC GAAATGCGTA GTGGTGGTTG ATCACTATGA CTGGGAGGAT 
GATGCCCCGC CGCGCACGCC GTGGGGCAGC ACCATCATTT ATGAAGCCCA TGTCAAAGGA 
TTAACGTACC TGCACCCGGA GATCCCGGTC GAGATCCGTG GCACTTATAA AGCCCTGGGG 
CATCCGGTGA TGATCAACTA TTTGAAACAG TTGGGCATTA CCGCGCTGGA ACTGCTGCCG 
GTGGCGCAGT TTGCCAGCGA ACCACGCCTG CAACGTATGG GTCTAAGTAA CTACTGGGGT 
TATAACCCGG TGGCGATGTT TGCGCTGCAT CCGGCGTATG CCTGCTCCCC AGAAACGGCG 
CTGGATGAGT TTCGCGATGC AATCAAAGCA CTGCATAAAG CGGGTATCGA AGTCATTCTT 
GATATCGTGC TCAACCATAG TGCGGAACTG GACCTCGACG GTCCGTTATT CTCTCTGCGT 
GGGATCGACA ACCGTAGCTA TTATTGGATA AGAGAAGACG GCGATTATCA CAACTGGACC 
GGTTGTGGCA ACACGCTCAA TTTGAGTCAT CCGGCGGTAG TGGATTATGC CAGCGCTTGC 
CTGCGTTATT GGGTAGAAAC CTGCCACGTC GATGGTTTCC GCTTTGATCT GGCGGCAGTC 
ATGGGCCGTA CGCCAGAGTT CCGTCAGGAT GCGCCGTTGT TTACCGCTAT CCAGAACTGC 
CCGGTGCTCT CGCAGGTGAA GTTAATTGCT GAACCGTGGG ATATTGCTCC TGGTGGTTAT 
CAGGTGGGAA ATTTCCCGCC GCTGTTTGCC GAGTGGAACG ATCATTTCCG CGATGCTGCC 
CGTCGTTTCT GGCTTCATTA TGATTTGCCT CTGGGGGCGT TTGCCGGGCG TTTTGCTGCC 
TCCAGCGATG TTTTTAAACG TAATGATCGT CTGCCGAGTG CCGCGATTAA TCTCGTCACC 
GCGCATGACG GTTTTACGCT TCGCGACTGC GTTTGCTTCA ACCATAAACA CAATGAAGCA 
AACGGAGAAG AAAATCGCGA CGGGACCAAC AACAATTACA GTAACAATCA TGGTAAAGAA 
GGGTTAGGCG GTACTCTTGA CCTGGTTGAA CGGCGTCGCG ACAGCATTCA CGCCCTGTTA 
ACAACGTTGT TGCTCTCCCA GGGTACGCCG ATGTTACTGG CCGGTGACGA ACATGGTCAC 
AGCCAGCATG GCAATAACAA TGCCTACTGT CAGGATAACC AATTAACCTG GTTGGACTGG 
TCGCAGGCAA GCAGTGGTTT AACCGCATTT ACCGCCGCGT TAATCCATCT GCGCAAGCGC 
ATTCCCGCTT TGGTGGAGAA TCGCTGGTGG GAAGAAGGCG ACGGCAATGT CCGTTGGCTA 
AATCGATATG CTCAACCTTT AAGCACGGAT GAGTGGCAAA ACGGGCCGAA ACAGCTGCAA 
ATTCTGCTCT CGGATCGCTT TTTGATCGCA ATTAACGCCA CGCTTGAGGT AACAGAGATT 
GTTTTACCTG CTGGGGAGTG GCACGCCATT CCCCCATTCG CTGGAGAGGA TAACCCAGTG 
ATTACGGCTG TCTGGCAGGG ACCTGCACAC GGATTGTGTG TGTTCCAGAG ATGA

Protein sequence

MTQLAIGKPT PLGAHYDGQG VNFTLFSAHA ERVELCVFDA NGQEHRYDLP GHSGDIWHGY 
LPDARPGLRY GYRVHGPWQP AEGHRFNPAK LLIDPCARQI DGEFKDNPLL HAGHNEPDYR 
DNAAIAPKCV VVVDHYDWED DAPPRTPWGS TIIYEAHVKG LTYLHPEIPV EIRGTYKALG 
HPVMINYLKQ LGITALELLP VAQFASEPRL QRMGLSNYWG YNPVAMFALH PAYACSPETA 
LDEFRDAIKA LHKAGIEVIL DIVLNHSAEL DLDGPLFSLR GIDNRSYYWI REDGDYHNWT 
GCGNTLNLSH PAVVDYASAC LRYWVETCHV DGFRFDLAAV MGRTPEFRQD APLFTAIQNC 
PVLSQVKLIA EPWDIAPGGY QVGNFPPLFA EWNDHFRDAA RRFWLHYDLP LGAFAGRFAA 
SSDVFKRNDR LPSAAINLVT AHDGFTLRDC VCFNHKHNEA NGEENRDGTN NNYSNNHGKE 
GLGGTLDLVE RRRDSIHALL TTLLLSQGTP MLLAGDEHGH SQHGNNNAYC QDNQLTWLDW 
SQASSGLTAF TAALIHLRKR IPALVENRWW EEGDGNVRWL NRYAQPLSTD EWQNGPKQLQ 
ILLSDRFLIA INATLEVTEI VLPAGEWHAI PPFAGEDNPV ITAVWQGPAH GLCVFQR