Gene SeAg_B1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B1066
Symbol	hpaX
ID	6797358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	1064027
End bp	1065403
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	53%
IMG OID	642775335
Product	4-hydroxyphenylacetate permease
Protein accession	YP_002145976
Protein GI	197249211
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR02332] 4-hydroxyphenylacetate permease

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA CATCATCTGC ACTTCCGGAA AGCCCCGAGT CTGTCAGTTC GCACAACGCG 
CTCAGCACGG GTCAACAAAC CGTCATAAAT AAACTGTTCC GCCGACTGAT CGTATTTTTA 
TTCGTGTTGT TTATCTTCTC GTTTTTAGAC CGTATCAACA TCGGTTTTGC CGGGTTGACG 
ATGGGGCAGG ATCTGGGATT AAGCGCCACC ATGTTTGGCC TTGCCACGAC GCTGTTTTAC 
GCCACCTACG TCATTTTCGG CATTCCCAGC AACGTGATGT TGAGCATCGT CGGCGCCCGC 
CGCTGGATTG CGACCATTAT GGTGCTATGG GGCATTGCAT CTACCGCCAC GATGTTCGCG 
GTGGGACCGA AAAGCCTGTA TGTGCTGCGA ATGCTGGTGG GCATTACCGA AGCGGGCTTT 
TTGCCAGGAA TATTGCTCTA TTTAACTTAC TGGTTTCCGG CATTTTTCCG CGCCCGCGCC 
AACGCATTAT TTATGATTGC CATGCCGGCC ACTACCGCGT TGGGGTCGAT TGTCTCCGGC 
TATATTTTAT CGCTGGACGG CATATTCAAT CTGCATGGAT GGCAGTGGTT ATTCCTGCTG 
GAAGGATTTC CGTCAGTTTT GTTAGGCATT ATGGTCTGGT TTTACCTGGA TGATACCCCG 
GCAAAAGCCA AATGGCTGAC GGCAGAGGAT AAAAAATGTT TGCAGGAGAT GATGGATAAT 
GACCGCCTGA CGCTGGTTCA GCCGGAGGGG GCCATCAGCC ATAACGCCAT GCAGCAGCGT 
AGTCTGTGGC GCGAAGTATT CACGCCAATT GTACTGATGT ATACGCTGGC CTATTTTTGC 
CTTACCAATA CGCTTAGCGC CATTAGTATC TGGACGCCGC AAATCCTGAA AAGTTTTAAT 
GAAGGCAGCA GCAATATCAC CATCGGCCTG CTGGCGGCGA TCCCGCAGAT TTGTACTATT 
CTGGGCATGA TTTACTGGAG CCGCCATTCG GACAAACATC AGGAGCGTAA ACATCACACG 
GCGTTGCCGT TCCTGTTTGC CGCCGCGGGC TGGCTGCTGG CGTCGGCGAC CGACCATAAC 
TTGATCCAGC TCCTGGGGAT CGTGATGGCA TCCACGGGTT CCTTTAGCGC GATGGCGATC 
TTCTGGACCA CGCCGGATCA GTCGATCAGT TTACGCGCCA GGGCGATAGG CATTGCGGTC 
ATCAATGCCA CCGGCAATAT TGGCTCCGCA CTTAGCCCGT TTATGATTGG CTGGCTAAAA 
GATATCACCG GTAGCTTCAA TAGCGGACTC TGGTTTGTCG CTTCTCTGTT AGTCGTCGGC 
GCCGCCATTA TCTGGCTCAT TCCCATGAAA GCATCGCGTC CGCGCGCCAC CCCTTGA

Protein sequence

MSDTSSALPE SPESVSSHNA LSTGQQTVIN KLFRRLIVFL FVLFIFSFLD RINIGFAGLT 
MGQDLGLSAT MFGLATTLFY ATYVIFGIPS NVMLSIVGAR RWIATIMVLW GIASTATMFA 
VGPKSLYVLR MLVGITEAGF LPGILLYLTY WFPAFFRARA NALFMIAMPA TTALGSIVSG 
YILSLDGIFN LHGWQWLFLL EGFPSVLLGI MVWFYLDDTP AKAKWLTAED KKCLQEMMDN 
DRLTLVQPEG AISHNAMQQR SLWREVFTPI VLMYTLAYFC LTNTLSAISI WTPQILKSFN 
EGSSNITIGL LAAIPQICTI LGMIYWSRHS DKHQERKHHT ALPFLFAAAG WLLASATDHN 
LIQLLGIVMA STGSFSAMAI FWTTPDQSIS LRARAIGIAV INATGNIGSA LSPFMIGWLK 
DITGSFNSGL WFVASLLVVG AAIIWLIPMK ASRPRATP