Gene Ent638_3914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3914
Symbol	treF
ID	5111566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	4222501
End bp	4224150
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	56%
IMG OID	640494123
Product	trehalase
Protein accession	YP_001178620
Protein GI	146313546
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAACC AGAAATTACA TGCTGCAGAC ATTATCGAGT TCGAAATCGC AGAAGAGCTG 
CGCTATGAGA CCGATCCCTG CGAATTGAAA CTGGATGAGA TGATCGAGGC GGAGCCGGAA 
CCGGAGATGA TCGAAGGGCT GCCCGCATCC GATGCGCTCA CCCCTGCCGA TCGTTATCTG 
GAACTTTTTG AACACGTACA GTCGACGCGC CTGTTTGCGG ACAGCAAAAC ATTCCCTGAC 
TGCGCGCCGA AGATGGACCC GCTGGATATT CTGATTCGCT ACCGTAAGGT TCGACGCCAT 
CGAGACTTCG ACCTCGCCCG GTTTGTGGAG AATCACTTCT GGATGCCAGA TAATCTGACA 
ACTGAGTATG TCTCCGATCC CAGTCTGTCG CTCAAAGAAC ATATTGATAA TCTGTGGCCG 
GTGCTGACGC GCGAGCCGCA GGATCACATC CCATGGTCAT CGCTGCTGGC GCTGCCGCAG 
GCGTATATCG TGCCGGGCGG TCGATTCAGC GAAACTTACT ACTGGGATTC GTATTTCACT 
ATGCTGGGCC TAGCGGAAAG TGGGCGCAAC GATCTGCTCA AGTGCATGGC AGATAACTTC 
GCATGGATGA TTGAGCGCTA CGGCCATATC CCGAACGGCA ACCGTACCTA TTATCTCAGC 
CGCTCACAGC CGCCGGTATT TGCGCTGATG GTCGAGCTGT TTGAAGAGGA CGGCGTACGC 
GGGGCGAAGC GTTATCTGGA TCATCTGATG ATGGAGTATG CGTTCTGGAT GGACGGCGCT 
GACTCGCTGA TTCCGAACCA GGCCTACCGT CACACGGTGC GCATGCCGGA CGGCTCACTG 
CTCAACCGCT ATTGGGATGA CCGCGATACC CCGCGCGATG AGTCATGGAT AGAAGACGTT 
GAAACGGCCA AACACTCCAG TCGTCCGCCG AACGAAGTGT ATCGCGATCT GCGCGCAGGC 
GCGGCGTCCG GCTGGGATTA CTCCTCTCGC TGGCTGCGCG ATGCCGGACG GCTCGCCAGC 
ATCCGCACCA CGCAATTTAT CCCGATCGAT TTGAACGCGT TCTTGTTCAA ACTCGAAAGT 
GCAATTGCCA ATATTTCGGC ATCGAAAGGC GATAAAGAGA CGTCTGAGCT ATTTCGTCAA 
AAAGCCAATG ACCGCCGTGC CGCCGTGAAC CGATTCCTGT GGGATGACGA AAACAGCTGT 
TATCGCGATT ACGACTGGCG ACGCGAAGAG ATGGGGCTAT TTTCTGCCGC CAGCATCGTG 
CCTCTGTATG TCGGAATGGC GACGCACGAA CAAGCCGACC GTCTGGCGGA TACGGTCAAA 
GCCCGCTTGC TTACGCCGGG CGGAATTATG GCGACCGAAT ACGAAACCGG CGAGCAGTGG 
GATAAACCGA ACGGCTGGGC ACCGCTGCAA TGGATGGCCA TCCAGGGGTT CAAACAGTAC 
GGCAATGATT CACTGGGGGA TGAGATCGCC TGGAGCTGGC TGCAAACGGT GAATCACTTC 
TACAAAGCGC ATCACAAGTT GATTGAAAAA TATCACATTG CCAGCAGCAC ACCGCGCGAA 
GGGGGTGGGG GTGAATATCC GTTGCAGGAT GGTTTTGGCT GGACGAACGG CGTGGTGCGG 
CGTTTGATTG GGCTGTACGG GGAACCGTAG

Protein sequence

MFNQKLHAAD IIEFEIAEEL RYETDPCELK LDEMIEAEPE PEMIEGLPAS DALTPADRYL 
ELFEHVQSTR LFADSKTFPD CAPKMDPLDI LIRYRKVRRH RDFDLARFVE NHFWMPDNLT 
TEYVSDPSLS LKEHIDNLWP VLTREPQDHI PWSSLLALPQ AYIVPGGRFS ETYYWDSYFT 
MLGLAESGRN DLLKCMADNF AWMIERYGHI PNGNRTYYLS RSQPPVFALM VELFEEDGVR 
GAKRYLDHLM MEYAFWMDGA DSLIPNQAYR HTVRMPDGSL LNRYWDDRDT PRDESWIEDV 
ETAKHSSRPP NEVYRDLRAG AASGWDYSSR WLRDAGRLAS IRTTQFIPID LNAFLFKLES 
AIANISASKG DKETSELFRQ KANDRRAAVN RFLWDDENSC YRDYDWRREE MGLFSAASIV 
PLYVGMATHE QADRLADTVK ARLLTPGGIM ATEYETGEQW DKPNGWAPLQ WMAIQGFKQY 
GNDSLGDEIA WSWLQTVNHF YKAHHKLIEK YHIASSTPRE GGGGEYPLQD GFGWTNGVVR 
RLIGLYGEP