Gene SeHA_C3917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3917
Symbol	treF
ID	6487850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3788692
End bp	3790341
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	55%
IMG OID	642744024
Product	trehalase
Protein accession	YP_002047630
Protein GI	194449533
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.17594
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	102
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAACC AGAAATTAAA CCCCACGCCT TCTGAAGATC TGACTATTGA TGTCGATCTG 
CTTTATGAAA CAGACCCGTG CGAGTTAAAG CTGGATGAAA TGATCGAGGC GGAACCGGAG 
CCGGAGATGA TCGAGGGGCT TCCCGCCTCT GACGCCCTGA CCCCTGCCGA TCGGTATCTC 
GAACTGTTCG AGCATGTACA GTCAACAAAA CTGTTTCCAG ACAGTAAAAC GTTCCCGGAC 
TGCGCGCCGA AGATGGACCC GCTTGATATC CTGATCCGCT ATCGTAAGGT CAGACGCCAC 
CGTGATTTTG ACTTACGCCG CTTCGTCGAG AACCATTTCT GGCTACCGGA AACCTTATCC 
AGCGAGTATG TCTCTAACCC CGAAAACTCG CTCAAAGAAC ATATTGACCA GCTTTGGCCG 
ATACTGACGC GCGAACCGCA GGATCATATT CCGTGGTCTT CGCTGCTGGC GCTGCCGCAA 
TCCTATATCG TGCCGGGAGG CCGTTTTAGC GAAACCTATT ATTGGGACTC TTATTTTACC 
ATGCTGGGTC TGGCGGAAAG CGGGCGCGAA GACTTACTTA AATGTATGGC GGATAATTTC 
GCCTGGATGA TTGAAAACTA TGGCCATATT CCCAACGGCA ACCGGACCTA TTATCTGAGC 
CGCTCGCAGC CGCCGGTTTT CGCCCTGATG GTTGAACTGT TCGAAGAAGA TGGCGTACGC 
GGCGCGCGGC GTTATCTCGA CCATCTCAAA ATGGAATACG CCTTCTGGAT GGACGGCGCC 
GAATCGCTGG CGCTCAACCA GGCTTATCGC CACGTTGTGC GGATGCCGGA CGGTTCCCTG 
CTGAACCGCT ACTGGGACGA TCGCGACACG CCGCGCGACG AGTCCTGGCT GGAAGATGTC 
GAAACCGCAA AACACTCCGG TCGTCCGCCC AATGAAGTCT ACCGGGATTT GCGCGCCGGG 
GCGGCGTCCG GCTGGGACTA TTCTTCACGC TGGCTACGCG ATGCGGGCCG GCTTGCCAGC 
ATACGTACGA CCCAGTTTAT CCCTATCGAT TTGAACGCTT TTCTGTATAA ACTGGAGAGC 
GCTATCGCCA ATATTTCAGC ACTGAAAGGC GAACGTGACA CCGAGGCACT ATTTCGCCAG 
AAAGCCAGCG ATCGACGCGC CGCCGTGAAC CATTATCTGT GGGATGATGA AAACGGCTGT 
TATCGGGACT ATGACTGGCG ACGCGAAGAA ATGGCGCTCT TTTCCGCCGC CAGTATCGTG 
CCGCTGTATG TCGGTATGGC GAACCACGAG CAGGCCGACC GTCTGGCAAA TGTGGTACGC 
AGCCGTCTGT TAACGCCCGG CGGGATTATG GCGACCGAAT ACGAAACCGG CGAACAGTGG 
GATAAACCGA ACGGCTGGGC ACCGCTGCAA TGGATGGCGA TTCAGGGCTT CAAACGGTAT 
GGCGACGATA TGCTGGGCGA TGAAATCGCC CATAACTGGT TAAAAACAGT GAACCATTTT 
TATCAGGAGC ACCATAAACT GATCGAGAAA TACCATATTT CCGGCGGTAC GCCCCGCGAA 
GGCGGCGGGG GCGAGTATCC GCTACAGGAT GGGTTCGGCT GGACCAATGG CGTGGTGCGC 
CGCCTGATTG GCCTTTACGG AGAGCCTTAA

Protein sequence

MLNQKLNPTP SEDLTIDVDL LYETDPCELK LDEMIEAEPE PEMIEGLPAS DALTPADRYL 
ELFEHVQSTK LFPDSKTFPD CAPKMDPLDI LIRYRKVRRH RDFDLRRFVE NHFWLPETLS 
SEYVSNPENS LKEHIDQLWP ILTREPQDHI PWSSLLALPQ SYIVPGGRFS ETYYWDSYFT 
MLGLAESGRE DLLKCMADNF AWMIENYGHI PNGNRTYYLS RSQPPVFALM VELFEEDGVR 
GARRYLDHLK MEYAFWMDGA ESLALNQAYR HVVRMPDGSL LNRYWDDRDT PRDESWLEDV 
ETAKHSGRPP NEVYRDLRAG AASGWDYSSR WLRDAGRLAS IRTTQFIPID LNAFLYKLES 
AIANISALKG ERDTEALFRQ KASDRRAAVN HYLWDDENGC YRDYDWRREE MALFSAASIV 
PLYVGMANHE QADRLANVVR SRLLTPGGIM ATEYETGEQW DKPNGWAPLQ WMAIQGFKRY 
GDDMLGDEIA HNWLKTVNHF YQEHHKLIEK YHISGGTPRE GGGGEYPLQD GFGWTNGVVR 
RLIGLYGEP