Gene SeD_A3978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3978
Symbol	treF
ID	6874657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3815349
End bp	3816998
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	55%
IMG OID	642786935
Product	trehalase
Protein accession	YP_002217563
Protein GI	198243471
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.744709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAACC AGAAATTAAA CCCCACGCCT TCTGAAGATC TGACTATTGA TGTCGATCTG 
CTTTATGAAA CAGACCCGTG CGAGTTAAAG CTGGATGAAA TGATCGAGGC GGAACCGGAG 
CCGGAGATGA TCGAGGGGCT TCCCGCCTCT GACGCCCTGA CCCCTGCCGA TCGGTATCTC 
GAACTGTTCG AGCATGTACA GTCAACAAAA CTGTTTCCAG ACAGTAAAAC GTTCCCGGAC 
TGCGCGCCGA AGATGGACCC GCTTGATATC CTGATCCGCT ACCGTAAGGT CAGACGCCAC 
CGTGATTTTG ATTTACGCCG CTTCGTCGAG AACCATTTCT GGCTACCGGA AACCTTATCC 
AGCGAGTATG TCTCTAACCC CGAAAACTCG CTCAAAGAAC ATATTGACCA GCTTTGGCCG 
ATACTGACGC GCGAACCGCA GGATCATATT CCGTGGTCTT CGCTGCTGGC GCTGCCGCAA 
TCCTATATCG TGCCGGGAGG CCGCTTTAGC GAAACCTATT ATTGGGACTC TTATTTTACC 
ATGCTGGGTC TGGCGGAAAG CGGGCGCGAA GACTTACTTA AATGTATGGC GGATAATTTC 
GCCTGGATGA TTGAAAACTA TGGCCATATT CCCAACGGCA ACCGGACCTA TTATCTGAGC 
CGCTCGCAGC CGCCGGTTTT CGCCCTGATG GTTGAACTGT TCGAAGAAGA TGGCGTACGC 
GGCGCGCGGC GTTATCTCGA CCATCTCAAA ATGGAATACG CCTTCTGGAT GGACGGCGCC 
GAATCGCTGG CGCTCAACCA GGCTTATCGC CACGTTGTGC GGATGCCGGA CGGCTCCCTG 
CTGAACCGCT ACTGGGACGA TCGCGACACG CCGCGCGACG AGTCCTGGCT GGAAGATGTC 
GAAACCGCAA AACACTCCGG TCGTCCGCCC AATGAAGTCT ACCGGGATTT GCGCGCCGGG 
GCGGCGTCCG GCTGGGACTA TTCTTCACGC TGGCTACGCG ATGCGGGCCG GCTTGCCAGC 
ATACGTACGA CCCAGTTTAT CCCTATCGAT TTGAACGCTT TTCTGTATAA ACTGGAGAGC 
GCTATCGCCA ATATTTCAGC GCTGAAAGGC GAACGTGACA CCGAGGCGCT ATTTCGCCAG 
AAAGCCAGCG ATCGACGCGC CGCCGTGAAC CATTATTTGT GGGATGATGA AAACGGCTGT 
TATCGGGACT ATGACTGGCG ACGCGAAGAA ATGGCGCTCT TTTCCGCCGC CAGTATCGTG 
CCGCTGTATG TCGGTATGGC GAACCATGAG CAGGCCGACC GCCTGGCAAA TGTGGTACGT 
AGCCGTCTGT TAACGCCCGG CGGGATTATG GCGACCGAAT ACGAAACCGG CGAACAGTGG 
GATAAACCGA ACGGCTGGGC ACCGCTGCAA TGGATGGCGA TCCAGGGCTT CAAACGGTAT 
GGCGACGATA TGCTGGGCGA TGAAATCGCC CATAACTGGT TAAAAACAGT GAACCATTTT 
TATCAGGAGC ACCACAAACT GATCGAGAAA TACCATATTT CCGGCGGTAC GCCCCGCGAA 
GGCGGCGGGG GCGAGTATCC GCTACAGGAT GGGTTCGGCT GGACCAATGG CGTGGTGCGC 
CGCCTGATTG GCCTTTACGG AGAGCCTTAA

Protein sequence

MLNQKLNPTP SEDLTIDVDL LYETDPCELK LDEMIEAEPE PEMIEGLPAS DALTPADRYL 
ELFEHVQSTK LFPDSKTFPD CAPKMDPLDI LIRYRKVRRH RDFDLRRFVE NHFWLPETLS 
SEYVSNPENS LKEHIDQLWP ILTREPQDHI PWSSLLALPQ SYIVPGGRFS ETYYWDSYFT 
MLGLAESGRE DLLKCMADNF AWMIENYGHI PNGNRTYYLS RSQPPVFALM VELFEEDGVR 
GARRYLDHLK MEYAFWMDGA ESLALNQAYR HVVRMPDGSL LNRYWDDRDT PRDESWLEDV 
ETAKHSGRPP NEVYRDLRAG AASGWDYSSR WLRDAGRLAS IRTTQFIPID LNAFLYKLES 
AIANISALKG ERDTEALFRQ KASDRRAAVN HYLWDDENGC YRDYDWRREE MALFSAASIV 
PLYVGMANHE QADRLANVVR SRLLTPGGIM ATEYETGEQW DKPNGWAPLQ WMAIQGFKRY 
GDDMLGDEIA HNWLKTVNHF YQEHHKLIEK YHISGGTPRE GGGGEYPLQD GFGWTNGVVR 
RLIGLYGEP