Gene EcE24377A_3547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3547
Symbol
ID	5586281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3558543
End bp	3560894
Gene Length	2352 bp
Protein Length	783 aa
Translation table	11
GC content	55%
IMG OID	640927173
Product	putative glycosyl hydrolase
Protein accession	YP_001464542
Protein GI	157157505
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.733119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAA AAACTATTTT AACGCCAGTA ACCTGCGCTC TGCTGATAAG TTTTTCCGCC 
CATGCCGCTA ACGCCGACAA TTATAAAAAC GTGATTAACC GTACTGGCGC GCCGCAGTAC 
ATGAAGGATT ACGATTACGA CGATCACCAG CGTTTTAATC CGTTTTTCGA TCTCGGAGCC 
TGGCATGGTC ATCTGTTGCC AGACGGCCCT AACACCATGG GCGGCTTTCC GGGCGTTGCG 
CTGCTGACGG AAGAGTACAT CAACTTTATG GCCAGCAATT TCGACCGCCT GACCGTCTGG 
CAGGACGGCA AGAAAGTCGA CTTTACGCTG GAGGCATACA GTATTCCCGG TGCGCTGGTG 
CAAAAACTGA CAGCAAAAGA TGTGCAAGTC GAAATGACTC TGCGCTTCGC CACGCCGCGC 
ACGTCACTAC TGGAAACCAA AATCACCAGC AATAAACCGC TGGATCTGGT GTGGGACGGC 
GAACTGCTGG AAAAACTGGA AGCGAAAGAA GGGAAACCGC TTTCCGATAA AACCATTGCT 
GGCGAATACC CTGACTATCA GCGCAAAATC AGCGCCACCC GTGATGGCCT GAAAGTCACC 
TTTGGCAAAG TGCGCGCCAC CTGGGATCTG CTGACCTCCG GCGAATCGGA ATATCAGGTG 
CATAAATCCC TGCCGGTGCA GACTGAAATC AACGGTAATC GCTTTACCAG TAAGGCGCAT 
ATCAACGGTT CGACCACGCT CTACACCACC TATTCCCATC TGCTGACCGC TCAGGAAGTT 
AGCAAAGAGC AAATGCAGAT CCGCGATATT CTGGCGCGTC CGGCGTTTTA TCTCACCGCC 
TCGCAGCAAC GCTGGGAAGA ATACCTGAAG AAAGGGTTAA CCAATCCGGA TGCGACGCCG 
GAACAGACGC GCGTCGCGGT GAAAGCGATC GAAACGCTCA ACGGTAACTG GCGCTCACCG 
GGCGGTGCGG TGAAATTTAA CACCGTTACA CCGTCGGTGA CCGGGCGCTG GTTCTCCGGC 
AATCAGACCT GGCCGTGGGA TACCTGGAAG CAGGCGTTTG CGATGGCGCA TTTCAATCCG 
GACATCGCCA AAGAGAATAT CCGCGCGGTC TTCTCCTGGC AGATCCAGCC TGGCGATAGC 
GTGCGTCCGC AGGATGTGGG CTTTGTCCCC GACCTGATAG CGTGGAACCT TAGCCCCGAG 
CGTGGTGGCG ATGGCGGCAA CTGGAACGAA CGTAATACCA AACCCAGCCT TGCCGCCTGG 
TCGGTGATGG AAGTGTACAA CGTCACCCAG GATAAAGCCT GGTTGGCAGA GATGTACCCG 
AAACTGGTGG CCTATCACGA CTGGTGGTTA CGTAACCGCG ATCACAACGG CAACGGCGTG 
CCGGAATATG GCGCGACCCG CGACAAAGCC CACAACACTG AGAGCGGCGA GATGCTGTTT 
ACGGTGAAGA AAGGCAACAA AGAAGAGACG CAGTCTGGGC TGAACAACTA CGCCCGCGTG 
GTGGAGAAAG GCCAGTACGA CAGTCTGGAA ATTCCGGCAC AGGTCGCTGC GTCGTGGGAA 
TCGGGGCGTG ATGATGCCGC CGTCTTTGGT TTTATCGACA AAGAACAGCT GGATAAATAT 
GTTGCAAGCG GCGGCAAACG TAGCGACTGG ACGGTGAAAT TCGCCGAAAA CCGCAGTCAG 
GACGGAACGT TGCTGGGCTA CTCGCTATTG CAGGAGTCGG TGGATCAGGC CAGCTATATG 
TACAGCGATA ACCATTATCT GGCGGAGATG GCGACGATTC TCGGTAAACC GGAAGAAGCT 
AAGCGCTATC GCCAGTTGGC ACAGCAGCTC GCGGACTACA TCAACACCTG TATGTTCGAC 
CCGGCTACAC AGTACTTCTA TGACGTGCGT ATTGAAGATA AACCGCTGGC GAACGGCTGC 
GCGGGCAAAC CGATTGTTGA GCGCGGTAAA GGGCCGGAAG GCTGGTCGCC GCTGTTTAAC 
GGTGCGGCAA CGCAGGCCAA TGCCGACGCG GTGGTGAAGG TGATGCTCGA TCCTAAAGAG 
TTCAACACCT TTGTCCCGCT GGGAACGGCG GCGTTAACCA ATCCGGCTTT TGGCGCTGAT 
ATCTACTGGC GCGGGCGCGT ATGGGTGGAT CAGTTCTGGT TTGGTCTGAA AGGGATGGAG 
CGTTACGGTT ATCGTGATGA TGCCCTGAAG CTGGCGGATA CGTTCTTCCG GCACGCCAAA 
GGATTAACCG CCGATGGCCC AATTCAGGAG AATTACAACC CGCTGACTGG CGCGCAGCAA 
GGCGCACCAA ATTTCTCCTG GAGTGCCGCG CATTTGTATA TGTTGTATAA CGATTTTTTC 
CGTAAGCAAT AA

Protein sequence

MKIKTILTPV TCALLISFSA HAANADNYKN VINRTGAPQY MKDYDYDDHQ RFNPFFDLGA 
WHGHLLPDGP NTMGGFPGVA LLTEEYINFM ASNFDRLTVW QDGKKVDFTL EAYSIPGALV 
QKLTAKDVQV EMTLRFATPR TSLLETKITS NKPLDLVWDG ELLEKLEAKE GKPLSDKTIA 
GEYPDYQRKI SATRDGLKVT FGKVRATWDL LTSGESEYQV HKSLPVQTEI NGNRFTSKAH 
INGSTTLYTT YSHLLTAQEV SKEQMQIRDI LARPAFYLTA SQQRWEEYLK KGLTNPDATP 
EQTRVAVKAI ETLNGNWRSP GGAVKFNTVT PSVTGRWFSG NQTWPWDTWK QAFAMAHFNP 
DIAKENIRAV FSWQIQPGDS VRPQDVGFVP DLIAWNLSPE RGGDGGNWNE RNTKPSLAAW 
SVMEVYNVTQ DKAWLAEMYP KLVAYHDWWL RNRDHNGNGV PEYGATRDKA HNTESGEMLF 
TVKKGNKEET QSGLNNYARV VEKGQYDSLE IPAQVAASWE SGRDDAAVFG FIDKEQLDKY 
VASGGKRSDW TVKFAENRSQ DGTLLGYSLL QESVDQASYM YSDNHYLAEM ATILGKPEEA 
KRYRQLAQQL ADYINTCMFD PATQYFYDVR IEDKPLANGC AGKPIVERGK GPEGWSPLFN 
GAATQANADA VVKVMLDPKE FNTFVPLGTA ALTNPAFGAD IYWRGRVWVD QFWFGLKGME 
RYGYRDDALK LADTFFRHAK GLTADGPIQE NYNPLTGAQQ GAPNFSWSAA HLYMLYNDFF 
RKQ