Gene YpsIP31758_2358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2358
Symbol	hpaX
ID	5385889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2658018
End bp	2659385
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	49%
IMG OID	640865347
Product	4-hydroxyphenylacetate permease
Protein accession	YP_001401327
Protein GI	153949197
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR02332] 4-hydroxyphenylacetate permease

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.876442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATT CACTGTCTAC CGCACCGGGC GTTACCCCGC CGGTCAATAA AAACACACCA 
TTAAGTGCGC AGCAGCAGTC CGTCATTAAT AAACTGTTTC GCCGTCTGAT CCCGTTCTTA 
TTCTTGTTGT TTGTTTTTGC CTTCCTTGAT CGTATCAATA TTGGTTTTGC GGGTTTGACG 
ATGGGGAAGG ATTTAGGGCT AAGTGCCACG ACCTTTGGTT TAGCGACTAC ATTATTCTAC 
GTGACATATA TCTTATTCGC GATCCCCAGC AATATCATGT TGGGGATCGT GGGTGCCAGG 
CGTTGGATTG CGACCATTAT GGTGCTCTGG GGTATCGCCT CTACCGCGAC CTTATTTGCC 
GTCGGCCCCA ACAGTTTGTA TCTCTTACGA ATGATTGTTG GGATCACCGA AGCCGGTTTT 
TTACCCGGCA TTCTGGTGTA TTTAACTTAT TGGTTTCCGG CCCACTTTCG AGCCAGAGCC 
AATGCGCTGT TTATGGTGGC GATGCCAGTG ACTATGGCGC TCGGCTCTCT GGTTTCCGGC 
TATATTTTGG CGCTTGATGG TTTTTTGAAT ATGCGTGGTT GGCAGTGGCT ATTTCTGCTG 
GAAGGCTTTC CATCGGTCTT GCTGGGGGGG GTGGTCTGGT TCTATCTGGA CGATACCCCG 
CAGAAAGCGC GCTGGTTAAC GAAAGAAGAT AAACAGTGTC TGCAAGAGAT GCTGGAGAGT 
GACCGTTTGC AATTGGCGAA ACAGGCGGAT TATGGTGCCT TACCACAATC AGGGATGTGG 
CGGGAAATTT TCACCCCCGT GGTGCTGATG TATACACTGG CTTACTTCTG TTTAACCAAT 
ACCCTAAGTG CGGTGAATAT TTGGACGCCG CAGATCCTGC AAAGTTTTAA TCAGAGCAGC 
AGCAATATCA CTATCGGTCT GCTGGCCGCT ATCCCACAAG TTTGTACCAT TGCCGGCATG 
ATCTGGTGGA GTAGACGCTC GGATCGGGTT CAGGAACGCA AAATGCACAC GGTTTTGCCG 
TATCTGTTTG CCGCAGCGGG GTGGGTGCTG GCATCGGCCA CACAAAATAG CGTAATCCAG 
TTGTTAGGGA TCATTATGGC CTCGACCGGG TCATTTACGG CGATGGCGAT TTTCTGGACT 
ACACCGGATC AATCCATCAG CCTGAGAGCC AGAGCTGTTG GTATTGCAGT GATAAATGCC 
ACTGGAAATA TTGGTTCGGC TGTCAGCCCG GTTTTAATTG GTTGGTTGAA AGACCAGACC 
GGTAACTTTA ATTCCGGGCT GTATTTCGTT GCCGGTTTAT TGGTTATCGG GGCTGTTATT 
TTCTTGATGA TTCCAATGAA AAAGGCACCT CCAAAAGCCA TTTTCTAA

Protein sequence

MSDSLSTAPG VTPPVNKNTP LSAQQQSVIN KLFRRLIPFL FLLFVFAFLD RINIGFAGLT 
MGKDLGLSAT TFGLATTLFY VTYILFAIPS NIMLGIVGAR RWIATIMVLW GIASTATLFA 
VGPNSLYLLR MIVGITEAGF LPGILVYLTY WFPAHFRARA NALFMVAMPV TMALGSLVSG 
YILALDGFLN MRGWQWLFLL EGFPSVLLGG VVWFYLDDTP QKARWLTKED KQCLQEMLES 
DRLQLAKQAD YGALPQSGMW REIFTPVVLM YTLAYFCLTN TLSAVNIWTP QILQSFNQSS 
SNITIGLLAA IPQVCTIAGM IWWSRRSDRV QERKMHTVLP YLFAAAGWVL ASATQNSVIQ 
LLGIIMASTG SFTAMAIFWT TPDQSISLRA RAVGIAVINA TGNIGSAVSP VLIGWLKDQT 
GNFNSGLYFV AGLLVIGAVI FLMIPMKKAP PKAIF