Gene EcolC_2429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2429
Symbol	treA
ID	6066275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2678231
End bp	2679928
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	52%
IMG OID	641601838
Product	trehalase
Protein accession	YP_001725390
Protein GI	170020436
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.414079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCC CCGCACCTTC TCGCCCGCAA AAAATGGCGT TAATTCCAGC CTGTATCTTT 
TTGTGTTTCG CTGCGCTATC GGTGCAGGCA GAAGAAACAC CGGTAACACC ACAGCCGCCT 
GATATTTTAT TAGGGCCGCT GTTTAATGAT GTGCAAAACG CCAAACTTTT TCCGGACCAA 
AAAACCTTTG CCGATGCCGT GCCGAACAGC GATCCGCTGA TGATCCTTGC TGATTATCGG 
ATGCAGCAAA ACCAGAGCGG ATTTGATCTG CGCCATTTCG TTAACGTCAA TTTCACCCTG 
CCGAAAGAAG GCGAGAAATA TGTTCCGCCA GAGGGGCAGT CACTGCGCGA ACATATTGAC 
GGACTTTGGC CGGTATTAAC GCGTTCTACC GAAAACACCG AAAAATGGGA TTCTCTGTTA 
CCGCTGCCGG AACCTTATGT CGTGCCGGGC GGACGCTTTC GCGAGGTATA TTACTGGGAC 
AGTTACTTCA CCATGTTAGG ACTTGCCGAA AGCGGTCACT GGGATAAAGT CGCGGATATG 
GTGGCCAATT TTGCTCATGA AATAGACACT TACGGTCATA TTCCCAACGG CAACCGCAGT 
TACTATTTAA GCCGCTCGCA ACCGCCCTTC TTTGCCCTGA TGGTAGAGTT ACTGGCGCAG 
CATGAAGGCG ATGCCGCGTT GAAGCAATAC CTGCCGCAAA TGCAAAAAGA ATATGCTTAC 
TGGATGGACG GTGTTGAAAA CCTGCAAGCC GGACAACAGG AAAAACGCGT TGTCAAACTT 
CAGGATGGTA CCCTTCTCAA CCGCTACTGG GACGATCGCG ATACGCCACG ACCAGAGTCA 
TGGGTGGAAG ATATTGCCAC CGCCAAAAGC AATCCGAATC GACCTGCCAC TGAAATTTAC 
CGCGACCTGC GCTCTGCCGC TGCGTCTGGC TGGGATTTCA GCTCGCGCTG GATGGACAAC 
CCGCAGCAGT TAAATACCTT ACGCACCACC AGCATCGTAC CGGTCGATCT GAACAGCCTG 
ATGTTTAAAA TGGAAAAAAT CCTCGCCCGC GCCAGCAAAG CTGCCGGAGA TAACGCGATG 
GCAAACCAGT ACGAAACGCT GGCAAATGCC CGTCAAAAAG GGATCGAAAA ATACCTGTGG 
AACGATCAAC AAGGCTGGTA TGCCGATTAC GACCTGAAAA GTCATAAAGT GCGCAATCAG 
TTAACCGCGG CCGCCCTGTT CCCGCTGTAC GTCAATGCGG CAGCGAAAGA TCGCGCCAAC 
AAAATGGCGA CGGCGACGAA AACACATCTG CTGCAACCCG GCGGCCTGAA CACCACGTCG 
GTGAAAAGTG GGCAACAATG GGATGCGCCA AATGGCTGGG CACCGTTACA GTGGGTCGCG 
ACAGAAGGAT TACAAAACTA CGGGCAAAAA GAGGTGGCGA TGGACATTAG CTGGCACTTC 
CTGACCAATG TTCAGCACAC CTATGACCGG GAGAAAAAGC TGGTGGAAAA ATATGATGTC 
AGCACCACCG GAACGGGGGG CGGCGGTGGC GAATATCCAT TACAGGATGG CTTTGGCTGG 
ACCAATGGCG TGACGCTGAA AATGCTGGAT TTGATCTGCC CGAAAGAGCA ACCGTGTGAC 
AATGTTCCGG CGACGCGTCC GACCGTTAAG TCAGCAACGA CGCAACCCTC AACCAAAGAG 
GCACAACCCA CACCTTAA

Protein sequence

MKSPAPSRPQ KMALIPACIF LCFAALSVQA EETPVTPQPP DILLGPLFND VQNAKLFPDQ 
KTFADAVPNS DPLMILADYR MQQNQSGFDL RHFVNVNFTL PKEGEKYVPP EGQSLREHID 
GLWPVLTRST ENTEKWDSLL PLPEPYVVPG GRFREVYYWD SYFTMLGLAE SGHWDKVADM 
VANFAHEIDT YGHIPNGNRS YYLSRSQPPF FALMVELLAQ HEGDAALKQY LPQMQKEYAY 
WMDGVENLQA GQQEKRVVKL QDGTLLNRYW DDRDTPRPES WVEDIATAKS NPNRPATEIY 
RDLRSAAASG WDFSSRWMDN PQQLNTLRTT SIVPVDLNSL MFKMEKILAR ASKAAGDNAM 
ANQYETLANA RQKGIEKYLW NDQQGWYADY DLKSHKVRNQ LTAAALFPLY VNAAAKDRAN 
KMATATKTHL LQPGGLNTTS VKSGQQWDAP NGWAPLQWVA TEGLQNYGQK EVAMDISWHF 
LTNVQHTYDR EKKLVEKYDV STTGTGGGGG EYPLQDGFGW TNGVTLKMLD LICPKEQPCD 
NVPATRPTVK SATTQPSTKE AQPTP