Gene EcSMS35_3374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3374
Symbol
ID	6144723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3454879
End bp	3457230
Gene Length	2352 bp
Protein Length	783 aa
Translation table	11
GC content	54%
IMG OID	641618203
Product	putative glycosyl hydrolase
Protein accession	YP_001745352
Protein GI	170681156
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3408] Glycogen debranching enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA AAACTATTTT AACGCCAGTA ACCTGCGCTC TGCTGATAAG TTTTTCCGCC 
CATGCCGCTA ACGCCGACAA TTATAAAAAC GTGATTAACC GTACTGGCGC GCCGCAGTAC 
ATGAAGGATT ACGATTACGA CGATCACCAG CGTTTTAATC CGTTTTTCGA TCTCGGAGCC 
TGGCATGGTC ATCTGTTGCC AGACGGCCCG AACACCATGG GAGGTTTTCC TGGCGTTGCG 
CTGCTGACGG AAGAATACAT CAACTTTATG GCCAGCAATT TCGATCGCCT GACCGTCTGG 
CAAGACGGCA AGAAAGTCGA CTTCACGCTG GAGGCATACA GTATTCCCGG CGCGCTGGTG 
CAAAAACTGA CAGCAAAAGA TGTGCAGGTC GAAATGACTC TGCGCTTCGC CACGCCGCGC 
ACATCACTAC TGGAAACCAA AATCACCAGC GATAAACCGC TGGATCTGGT GTGGGATGGT 
GAACTGCTGG AAAAACTGGA AGCGAAAGAA GGGAAACCGC TTTCCGATAA AACCATTGCT 
GGCGAATACC CTGACTATCA GCGCAAAATC AGCGCCACCC GTGATGGCCT GAAAGTCACC 
TTTGGCAAAG TGCGCGCCAC CTGGGATCTG CTGACCTCCG GTGAATCAGA ATATCAGGTG 
CATAAATCCC TGCCAGTGCA GACTGAAATC AACGGCAATC GCTTTACCAG TAAGGCGCAT 
ATCAACGGTT CGACCACGCT CTATACCACC TATTCCCATC TGCTGACCGC TCAGGAAGTT 
AGCAAAGAGC AAATGCAGAT CCGCGATATT CTGGCGCGTC CGGCGTTTTA TCTCACCGCC 
TCGCAGCAAC GCTGGGAAGA GTATCTGAAG AAAGGGTTAA CCAATCCGGA TGCGACGCCG 
GAACAGACGC GCGTCGCGGT GAAAGCCATC GAAACACTCA ACGGTAACTG GCGCTCACCG 
GGCGGGGCGG TGAAATTTAA TACCGTCACA CCGTCGGTGA CCGGACGCTG GTTCTCCGGC 
AATCAGACCT GGCCGTGGGA TACCTGGAAA CAGGCGTTTG CGATGGCGCA TTTCAATCCG 
GACATCGCCA AAGAGAATAT CCGCGCGGTC TTCTCCTGGC AGATCCAACC TGGCGACACC 
GTGCGTCCAC AGGATGTGGG ATTTGTCTCC GACCTGATTG CGTGGAACCT TAGCCCCGAG 
CGTGGCGGCG ATGGCGGCAA CTGGAACGAA CGCAATACCA AGCCCAGCCT TGCCGCCTGG 
TCGGTGATGG AAGTGTACAA CGTCACCCAG GATAAAACCT GGCTGGCAGA GATGTACCCG 
AAACTGGTGG CCTATCACGA CTGGTGGTTA CGTAACCGCG ATCATAACGG CAACGGCGTG 
CCGGAATATG GCGCGACCCG CGATAAAGCC CATAACACCA AGAGCGGCGA GATGCTGTTT 
ACGGTGAAAA AAGGCGATAA AGAAGAGACG CTGTCTGGGC TGAACAACTA CGCCCGCGTG 
GTGGAGAAAG GCCAGTACGA CAGTCTGGAA ATCCCGGCAC AAGTTGCTGC GTCGTGGGAA 
TCAGGTCGTG ATGACGCCGC CGTCTTTGGG TTTATCGACA AAGAACAGCT GGATAAATAT 
GTCGCTAACG GCGGCAAACG TAGCGACTGG ACGGTGAAAT TCGCCGAAAA CCGCAGTCAG 
GACGGAACGT TGCTGGGCTA CTCGCTATTG CAGGAGTCGG TGGATCAGGC CAGCTATATG 
TACAGCGATA ACCATTATCT GGCGGAGATG GCAACCATAC TCGGTAAGCC GGAAGAGGCC 
AAACGCTATC GCCAGTTGGC ACAGCAGCTC GCGGACTACA TCAACACCTG TATGTTCGAC 
CCGACTACAC AGTTCTACTA TGACGTGCGC ATTGAAGATA AACCACTGGC GAACGGCTGC 
GCGGGCAAAC CGATTGTTGA GCGCGGTAAA GGGCCAGAAG GCTGGTCGCC GCTGTTTAAC 
GGTGCGGCAA CGCAGGCCAA CGCCGACGCG GTGGTGAAGG TGATGCTCGA TCCTAAAGAG 
TTCAACACCT TTGTACCGCT GGGAACGGCA GCGTTAACCA ACCCGGCTTT TGGCGCTGAT 
ATCTACTGGC GCGGGCGCGT ATGGGTAGAT CAGTTCTGGT TTGGTCTGAA AGGAATGGAG 
CGTTACGGTT ATCGTGATGA TGCCCTGAAA CTGGCGGATA CGTTCTTCCA GCATGCCAAA 
GGATTAACCG CCGATGGCCC GATTCAGGAG AATTACAACC CGCTGACTGG CGCACAGCAA 
GGCGCACCAA ATTTCTCCTG GAGTGCCGCG CATTTGTATA TGTTGTATAA CGATTTTTTC 
CGTAAGCAGT AA

Protein sequence

MKIKTILTPV TCALLISFSA HAANADNYKN VINRTGAPQY MKDYDYDDHQ RFNPFFDLGA 
WHGHLLPDGP NTMGGFPGVA LLTEEYINFM ASNFDRLTVW QDGKKVDFTL EAYSIPGALV 
QKLTAKDVQV EMTLRFATPR TSLLETKITS DKPLDLVWDG ELLEKLEAKE GKPLSDKTIA 
GEYPDYQRKI SATRDGLKVT FGKVRATWDL LTSGESEYQV HKSLPVQTEI NGNRFTSKAH 
INGSTTLYTT YSHLLTAQEV SKEQMQIRDI LARPAFYLTA SQQRWEEYLK KGLTNPDATP 
EQTRVAVKAI ETLNGNWRSP GGAVKFNTVT PSVTGRWFSG NQTWPWDTWK QAFAMAHFNP 
DIAKENIRAV FSWQIQPGDT VRPQDVGFVS DLIAWNLSPE RGGDGGNWNE RNTKPSLAAW 
SVMEVYNVTQ DKTWLAEMYP KLVAYHDWWL RNRDHNGNGV PEYGATRDKA HNTKSGEMLF 
TVKKGDKEET LSGLNNYARV VEKGQYDSLE IPAQVAASWE SGRDDAAVFG FIDKEQLDKY 
VANGGKRSDW TVKFAENRSQ DGTLLGYSLL QESVDQASYM YSDNHYLAEM ATILGKPEEA 
KRYRQLAQQL ADYINTCMFD PTTQFYYDVR IEDKPLANGC AGKPIVERGK GPEGWSPLFN 
GAATQANADA VVKVMLDPKE FNTFVPLGTA ALTNPAFGAD IYWRGRVWVD QFWFGLKGME 
RYGYRDDALK LADTFFQHAK GLTADGPIQE NYNPLTGAQQ GAPNFSWSAA HLYMLYNDFF 
RKQ