Gene ECD_03763 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03763
Symbol	yihQ
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3973934
End bp	3975937
Gene Length	2004 bp
Protein Length	667 aa
Translation table	11
GC content	54%
IMG OID
Product	alpha-glucosidase
Protein accession	ACT45556
Protein GI	253979886
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATCA TTTTACATAA GCCTGTAATA ACAGGAAGGC AACAACGTCT TATTTTAACC 
CATAGCAAAG ATAATCCTTG TTTATGGATT GGCTCAGGTA TAGCGGATAT CGATATGTTC 
CGCGGTAATT TCAGCATTAA AGATAAACTA CAGGAGAAAA TTGCGCTTAC CGACGCCATC 
GTCAGCCAGT CACCGGATGG TTGGTTAATT CATTTCAGCC GTGGTTCTGA CATTAGCGCC 
ACGCTGAATA TCTCTGCCGA CGATCAGGGG CGTTTATTGC TGGAACTACA AAACGACAAC 
CTTAACCACA ACCGTATCTG GCTGCGCCTT GCCGCTCAAC CAGAGGACCA TATCTACGGC 
TGCGGCGAAC AGTTTTCCTA CTTCGATCTG CGTGGCAAAC CGTTCCCGCT ATGGACCAGT 
GAACAAGGCG TTGGTCGCAA CAAACAAACC TATGTCACCT GGCAGGCCGA CTGCAAAGAA 
AATGCGGGCG GCGACTATTA CTGGACTTTC TTCCCACAGC CTACGTTTGT CAGCACGCAG 
AAGTATTACT GCCATGTTGA TAACAGTTGC TATATGAACT TCGACTTTAG TGCCCCGGAA 
TACCATGAAC TGGCGCTGTG GGAAGACAAA GCAACGCTGC GTTTTGAATG TGCTGACACA 
TACATTTCCC TGCTGGAAAA ATTAACCGCC CTGCTGGGAC GCCAGCCAGA ACTGCCCGAC 
TGGATTTATG ACGGAGTAAC GCTCGGCATT CAGGGCGGGA CGGAAGTGTG CCAGAAGAAA 
CTGGACACCA TGCGTAACGC GGGCGTGAAG GTCAACGGCA TCTGGGCGCA GGACTGGTCC 
GGTATTCGTA TGACCTCTTT TGGCAAACGC GTGATGTGGA ACTGGAAGTG GAACAGCGAA 
AACTACCCGC AACTGGATTC ACGCATTAAG CAGTGGAATC AGGAGGGCGT GCAGTTCCTG 
GCCTATATCA ACCCGTATGT TGCCAGCGAT AAAGATCTCT GCGAAGAAGC GGCACAACAC 
GGCTATCTGG CAAAAGATGC CTCTGGCGGT GACTATCTGG TGGAGTTTGG CGAGTTTTAC 
GGCGGCGTTG TCGATCTCAC TAATCCAGAA GCCTACGCCT GGTTCAAGGA AGTGATCAAA 
AAGAACATGA TTGAACTCGG CTGCGGCGGC TGGATGGCTG ACTTCGGCGA GTATCTGCCC 
ACCGACACGT ACCTGCATAA CGGCGTCAGT GCCGAAATTA TGCATAACGC CTGGCCTGCG 
CTGTGGGCGA AGTGTAACTA CGAAGCCCTT GAAGAAACGG GCAAGCTCAG CGAGATCCTT 
TTCTTTATGC GCGCCGGTTC TACCGGTAGC CAGAAATACT CCACCATGAT GTGGGCGGGC 
GACCAGAACG TCGACTGGAG TCTCGACGAT GGCCTGGCGT CGGTTGTCCC GGCGGCGCTG 
TCGCTGGCAA TGACCGGACA TGGCCTGCAC CACAGCGACA TTGGCGGTTA CACCACCCTG 
TTTGAGATGA AGCGCAGCAA AGAGCTGCTG CTGCGCTGGT GCGATTTCAG CGCCTTCACG 
CCGATGATGC GCACCCACGA AGGTAACCGT CCTGGCGACA ACTGGCAGTT TGACGGCGAC 
GCAGAAACCA TCGCCCATTT CGCCCGTATG ACCACCGTCT TCACCACCCT GAAACCTTAC 
CTGAAAGAGG CCGTCGCGCT GAATGCGAAG TCCGGCCTGC CGGTTATGCG CCCGCTGTTC 
CTGCATTACG AAGACGATGC GCACACTTAC ACCCTGAAAT ATCAGTACCT GTTAGGTCGC 
GACATTCTGG TCGCTCCGGT GCATGAAGAA GGCCGTAGCG ACTGGACGCT CTATCTGCCG 
GAGGATAACT GGGTCCACGC CTGGACGGGT GAAGCGTTCC GGGGCGGGGA AGTTACCGTT 
AATGCGCCCA TCGGCAAGCC GCCGGTCTTT TATCGCGCCG ATAGCGAATG GGCGGCACTG 
TTCGCGTCGT TAAAAAGCAT CTAA

Protein sequence

MRIILHKPVI TGRQQRLILT HSKDNPCLWI GSGIADIDMF RGNFSIKDKL QEKIALTDAI 
VSQSPDGWLI HFSRGSDISA TLNISADDQG RLLLELQNDN LNHNRIWLRL AAQPEDHIYG 
CGEQFSYFDL RGKPFPLWTS EQGVGRNKQT YVTWQADCKE NAGGDYYWTF FPQPTFVSTQ 
KYYCHVDNSC YMNFDFSAPE YHELALWEDK ATLRFECADT YISLLEKLTA LLGRQPELPD 
WIYDGVTLGI QGGTEVCQKK LDTMRNAGVK VNGIWAQDWS GIRMTSFGKR VMWNWKWNSE 
NYPQLDSRIK QWNQEGVQFL AYINPYVASD KDLCEEAAQH GYLAKDASGG DYLVEFGEFY 
GGVVDLTNPE AYAWFKEVIK KNMIELGCGG WMADFGEYLP TDTYLHNGVS AEIMHNAWPA 
LWAKCNYEAL EETGKLSEIL FFMRAGSTGS QKYSTMMWAG DQNVDWSLDD GLASVVPAAL 
SLAMTGHGLH HSDIGGYTTL FEMKRSKELL LRWCDFSAFT PMMRTHEGNR PGDNWQFDGD 
AETIAHFARM TTVFTTLKPY LKEAVALNAK SGLPVMRPLF LHYEDDAHTY TLKYQYLLGR 
DILVAPVHEE GRSDWTLYLP EDNWVHAWTG EAFRGGEVTV NAPIGKPPVF YRADSEWAAL 
FASLKSI