Gene SNSL254_A3939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3939
Symbol	xylA
ID	6485548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3818818
End bp	3820140
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	54%
IMG OID	642739199
Product	xylose isomerase
Protein accession	YP_002042909
Protein GI	194444823
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.619988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCTT ATTTTGACCA ACTCGATCGT GTTCGCTATG AAGGCCCTCA ATCGACTAAC 
CCGCTGGCAT TTCGTCATTA CAATCCCGAC GAGCTGGTTT TAGGTAAACG TATGGAAGAT 
CACCTGCGTT TCGCGGCCTG TTACTGGCAT ACCTTCTGCT GGAACGGCGC GGATATGTTT 
GGTGTAGGCG CGTTTAATCG TCCGTGGCAG CAACCGGGCG AAGCGCTGGA GCTGGCGAAA 
CGCAAAGCGG ACGTGGCGTT TGAATTTTTC CACAAACTGA ATGTGCCTTT TTATTGCTTC 
CATGACGTGG ATGTGTCGCC GGAAGGCGCG TCGTTGAAAG AATATAAAAA CAACTTCGCG 
CAGATGGTGG ATGTGCTGGC GGCGAAACAG GAGCAGAGCG GCGTAAAACT GCTGTGGGGA 
ACGGCGAACT GCTTTACCAA CCCGCGCTAT GGCGCAGGCG CCGCCACTAA CCCGGACCCG 
GAAGTCTTTA GCTGGGCAGC GACGCAAGTG GTTACGGCAA TGAACGCCAC GCATAAACTG 
GGCGGCGAAA ATTACGTCCT GTGGGGCGGG CGCGAAGGTT ATGAAACGTT GCTGAATACC 
GATCTGCGCC AGGAACGCGA ACAGATTGGC CGCTTTATGC AAATGGTGGT CGAGCACAAA 
CATAAAATGG GCTTCCAGGG CACGCTGCTG ATTGAACCGA AACCGCAGGA ACCGACAAAA 
CATCAGTATG ATTATGACGT TGCAACGGTC TATGGCTTCC TCAAACAGTT CGGCCTGGAA 
AAAGAGATCA AAGTGAACAT TGAGGCGAAC CACGCGACGC TGGCGGGCCA TTCGTTCCAC 
CATGAAATCG CGACCGCTAT CGCGCTGGGT ATTTTTGGCT CCGTTGACGC CAACCGCGGT 
GATGCGCAAC TGGGCTGGGA TACCGATCAG TTCCCGATTA GCGTTGAAGA GAACGCGCTG 
GTGATGTACG AAATCCTGAA AGCGGGCGGA TTCACGACGG GCGGTCTCAA CTTCGACGCC 
AAAGTTCGTC GCCAGAGCAC CGATAAATAC GATCTGTTCT ACGGTCATAT CGGCGCGATG 
GATACGATGG CGTTGTCGCT GAAAATCGCC GCGCGTATGG TTGAAGACGG CGAGCTGGAT 
AAACGCGTGG CGAAGCGCTA TGCCGGCTGG AATGGCGAGC TGGGTCAGCA GATTCTGAAA 
GGACAACTCT CCTTAGGCGA ACTGGCGCAG TATGCGGAGC AGCATAATCT GGCGCCAGTA 
CATCAAAGCG GTCATCAGGA GCTGTTAGAA AATCTGGTTA ACCGTTATCT GTTTGATAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGPQSTN PLAFRHYNPD ELVLGKRMED HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALELAK RKADVAFEFF HKLNVPFYCF HDVDVSPEGA SLKEYKNNFA 
QMVDVLAAKQ EQSGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMNATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQIG RFMQMVVEHK HKMGFQGTLL IEPKPQEPTK 
HQYDYDVATV YGFLKQFGLE KEIKVNIEAN HATLAGHSFH HEIATAIALG IFGSVDANRG 
DAQLGWDTDQ FPISVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALSLKIA ARMVEDGELD KRVAKRYAGW NGELGQQILK GQLSLGELAQ YAEQHNLAPV 
HQSGHQELLE NLVNRYLFDK