Gene SeHA_C3984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3984
Symbol	xylA
ID	6488191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3859558
End bp	3860880
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	54%
IMG OID	642744085
Product	xylose isomerase
Protein accession	YP_002047690
Protein GI	194451711
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02630] xylose isomerase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	91
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCTT ATTTTGACCA ACTCGATCGT GTTCGCTATG AAGGCCCTCA ATCGACTAAC 
CCGCTGGCAT TTCGTCATTA CAATCCCGAC GAGCTGGTTT TAGGTAAACG TATGGAAGAT 
CACCTGCGTT TCGCGGCCTG TTACTGGCAT ACCTTCTGCT GGAACGGCGC GGATATGTTT 
GGTGTAGGCG CGTTTAATCG TCCGTGGCAG CAACCGGGCG AAGCGCTGGA GCTGGCGAAA 
CGCAAAGCGG ACGTGGCGTT TGAATTTTTC CACAAACTGA ATGTGCCTTT TTATTGCTTC 
CATGACGTGG ATGTGTCGCC GGAAGGCGCG TCGTTGAAAG AATATAAAAA CAACTTCGCG 
CAGATGGTGG ATGTGCTGGC GGCGAAACAG GAGCAGAGCG GCGTAAAACT GCTGTGGGGA 
ACGGCGAACT GCTTTACCAA CCCGCGCTAT GGCGCAGGCG CCGCCACTAA CCCGGATCCG 
GAAGTCTTTA GCTGGGCAGC GACGCAAGTG GTTACGGCAA TGAACGCCAC GCATAAACTG 
GGCGGCGAAA ATTACGTCCT GTGGGGCGGG CGCGAAGGTT ATGAAACGTT GCTGAATACC 
GATCTGCGCC AGGAACGCGA ACAGATTGGC CGCTTTATGC AAATGGTGGT CGAGCACAAA 
CATAAAATGG GTTTCCAGGG CACGCTGCTG ATTGAACCGA AACCGCAGGA ACCGACTAAA 
CATCAGTATG ATTATGACGT TGCAACGGTT TATGGCTTCC TCAAACAGTT CGGCCTGGAA 
AAAGAGATCA AAGTGAACAT TGAGGCGAAC CACGCGACGC TGGCGGGCCA TTCGTTCCAC 
CATGAAATCG CAACCGCTAT CGCGCTGGGT ATTTTTGGCT CCGTTGACGC CAACCGCGGC 
GATGCGCAAC TGGGCTGGGA TACCGATCAG TTCCCGATTA GCGTTGAAGA GAACGCGCTG 
GTGATGTACG AAATCCTGAA AGCGGGCGGA TTCACGACGG GCGGTCTCAA CTTCGACGCC 
AAAGTTCGTC GCCAGAGCAC CGATAAATAC GATCTGTTCT ACGGTCATAT CGGCGCGATG 
GATACGATGG CGTTGTCGCT GAAAATCGCC GCGCGTATGG TTGAAGACGG CGAGCTGGAT 
AAACGCGTGG CGAAGCGCTA TGCCGGCTGG AATGGCGAGC TGGGTCAGCA GATTCTGAAA 
GGACAACTCT CCTTAGGCGA ACTGGCGCAG TATGCGGAGC AGCATAATCT GGCGCCAGTA 
CATCAAAGCG GTCATCAGGA GCTGTTAGAA AATCTGGTTA ACCGTTATCT GTTTGATAAA 
TAA

Protein sequence

MQAYFDQLDR VRYEGPQSTN PLAFRHYNPD ELVLGKRMED HLRFAACYWH TFCWNGADMF 
GVGAFNRPWQ QPGEALELAK RKADVAFEFF HKLNVPFYCF HDVDVSPEGA SLKEYKNNFA 
QMVDVLAAKQ EQSGVKLLWG TANCFTNPRY GAGAATNPDP EVFSWAATQV VTAMNATHKL 
GGENYVLWGG REGYETLLNT DLRQEREQIG RFMQMVVEHK HKMGFQGTLL IEPKPQEPTK 
HQYDYDVATV YGFLKQFGLE KEIKVNIEAN HATLAGHSFH HEIATAIALG IFGSVDANRG 
DAQLGWDTDQ FPISVEENAL VMYEILKAGG FTTGGLNFDA KVRRQSTDKY DLFYGHIGAM 
DTMALSLKIA ARMVEDGELD KRVAKRYAGW NGELGQQILK GQLSLGELAQ YAEQHNLAPV 
HQSGHQELLE NLVNRYLFDK