Gene SNSL254_A3875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3875
Symbol	treF
ID	6483013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3750128
End bp	3751777
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	56%
IMG OID	642739140
Product	trehalase
Protein accession	YP_002042851
Protein GI	194445655
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1626] Neutral trehalase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAACC AGAAATTAAA CCCCACGCCT TCTGAAGATC TGACTATTGA TGTCGATCTG 
CTTTATGAAA CAGACCCGTG CGAGTTAAAG CTGGATGAAA TGATCGAGGC GGAACCGGAG 
CCGGAGATGA TCGAGGGGCT TCCCGCCTCT GACGCCCTGA CCCCTGCCGA TCGGTATCTC 
GAACTGTTCG AGCATGTACA GTCAACAAAA CTGTTTCCAG ACAGTAAAAC GTTCCCGGAC 
TGCGCGCCGA AGATGGACCC GCTTGATATC CTGATCCGCT ACCGTAAGGT CAGACGCCAC 
CGTGATTTTG ACTTACGCCG CTTCGTCGAG AACCATTTCT GGCTACCGGA AACCTTATCC 
AGCGAGTATG TCTCTAACCC CGAAAACTCG CTCAAAGAAC ATATTGACCA GCTTTGGCCG 
ATACTGACGC GCGAACCGCA GGATCATATT CCGTGGTCTT CGCTGCTGGC GCTGCCGCAA 
TCCTATATCG TGCCGGGAGG CCGTTTTAGC GAAACCTATT ATTGGGACTC TTATTTTACC 
ATGCTGGGTC TGGCGGAAAG CGGGCGCGAA GACTTACTTA AATGTATGGC GGATAATTTC 
GCCTGGATGA TTGAAAACTA TGGCCATATT CCCAACGGCA ACCGCACCTA TTACCTGAGC 
CGCTCGCAGC CGCCGGTTTT CGCCCTGATG GTTGAACTGT TCGAAGAAGA TGGCGTGCGC 
GGCGCGCGGC GTTATCTCGA CCATCTCAAA ATGGAATACG CCTTCTGGAT GGACGGCGCC 
GAATCGCTGG CGCTCAACCA GGCTTATCGC CACGTTGTGC GGATGCCGGA CGGTTCCCTG 
CTGAACCGCT ACTGGGACGA TCGCGACACG CCGCGCGACG AGTCGTGGCT GGAAGATGTC 
GAAACCGCAA AACACTCCGG TCGTCCGCCC AATGAAGTCT ACCGGGATTT GCGCGCCGGG 
GCGGCGTCCG GCTGGGACTA TTCTTCACGC TGGCTACGCG ATGCGGGCCG GCTTGCCAGC 
ATACGTACGA CCCAGTTTAT CCCTATCGAT TTGAACGCTT TTCTGTATAA ACTGGAGAGC 
GCTATCGCCA ATATTTCAGC GCTGAAAGGC GAACGTGACA CCGAGGCGCT ATTTCGCCAG 
AAAGCCAGCG ACCGACGCGC CGCCGTGAAC CATTATCTGT GGGATGATGA AAACGGCTGT 
TATCGGGACT ATGACTGGCG ACGCGAAGAA ATGGCGCTCT TTTCCGCCGC CAGTATCGTG 
CCGCTGTATG TCGGTATGGC GAACCATGAG CAGGCCGACC GTCTGGCAAA TGTGGTGCGC 
AGCCGTCTGT TAACGCCCGG CGGGATTATG GCGACCGAAT ACGAAACCGG CGAACAGTGG 
GATAAACCGA ACGGCTGGGC ACCGCTGCAA TGGATGGCGA TCCAGGGCTT CAAACGGTAT 
GGCGACGATA TGCTGGGCGA TGAAATCGCC CATAACTGGT TAAAAACGGT GAACCATTTT 
TATCAGGAGC ACCATAAACT GATCGAGAAA TACCATATTT CCGGCGGTAC GCCCCGCGAA 
GGCGGCGGGG GCGAGTATCC GCTACAGGAC GGGTTCGGCT GGACCAATGG CGTGGTGCGC 
CGCCTGATTG GCCTTTACGG AGAGCCTTAA

Protein sequence

MLNQKLNPTP SEDLTIDVDL LYETDPCELK LDEMIEAEPE PEMIEGLPAS DALTPADRYL 
ELFEHVQSTK LFPDSKTFPD CAPKMDPLDI LIRYRKVRRH RDFDLRRFVE NHFWLPETLS 
SEYVSNPENS LKEHIDQLWP ILTREPQDHI PWSSLLALPQ SYIVPGGRFS ETYYWDSYFT 
MLGLAESGRE DLLKCMADNF AWMIENYGHI PNGNRTYYLS RSQPPVFALM VELFEEDGVR 
GARRYLDHLK MEYAFWMDGA ESLALNQAYR HVVRMPDGSL LNRYWDDRDT PRDESWLEDV 
ETAKHSGRPP NEVYRDLRAG AASGWDYSSR WLRDAGRLAS IRTTQFIPID LNAFLYKLES 
AIANISALKG ERDTEALFRQ KASDRRAAVN HYLWDDENGC YRDYDWRREE MALFSAASIV 
PLYVGMANHE QADRLANVVR SRLLTPGGIM ATEYETGEQW DKPNGWAPLQ WMAIQGFKRY 
GDDMLGDEIA HNWLKTVNHF YQEHHKLIEK YHISGGTPRE GGGGEYPLQD GFGWTNGVVR 
RLIGLYGEP