Gene YpsIP31758_1871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1871
Symbol
ID	5385841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	2167277
End bp	2168545
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	47%
IMG OID	640864855
Product	major facilitator transporter
Protein accession	YP_001400846
Protein GI	153949397
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.00512651
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGCCAG CATCAACAAA AAATGATGAT GACACTGTTT TCACTACGAT CCCTAAACTG 
CCTCCCCTAA ATAAGCGTCC TTATATACAA CAAGGTACGC CAGAATTCAT CCGCGTTGCT 
CTGGCTTTAT TTTCGGCGGG GTTAGCAACT TTCGCCCTGC TTTACTGCGT ACAACCTATT 
TTGCCCATGT TGTCGCAGGA CTTTAGTACC TCTCCAGCGT CCAGCAGTTT GTCACTTTCG 
ATAGCCACCG GGATGCTGGC GTTGGGTTTG ATGTTTACCG GCCCCCTTTC TGATGCGATA 
GGCCGAAAAT CAGTCATGGT CGTGGCGTTG CTATTGGCCG CGGTTTGCAC AATAGTTTGC 
TCTTTTATGA CCAGTTGGCA TGGGATTTTG CTAATGCGCG CATTGACCGG TCTATCCTTA 
AGCGGAGTTG CCGCGGTGGC AATGACCTAT TTGAGTGAAG AGATCCATCC TAATTTTATT 
GCGCTATCAA TGGGGTTGTA TATCAGCGGT AGTTCTATTG GTGGCATGAG TGGGCGTTTG 
GTGGCTGGGG TATTAAGCGA TCTCTTTTCC TGGCGCGTAT CACTGCTAGT ACTCGGATTA 
TTTGCTTTAG CTGCTGCTTG CTTGTTTTGG TTTATCCTCC CAGCGTCTAA ACACTTTCGT 
GCAAGTTCAT TGCGCCCCAG AACGTTGTTA ATCAATTTTA AACTGCACTG GCGTGACTCC 
GGCTTACCCC TACTATTTGC TGAAGGTTTT CTCATTATGG GGGGGTTCGT CACCTTATTT 
AATTATATCG GCTATCGGTT ACTGGATGGG CCTTATTATC TCAGCCCGAC CATCGTAGGG 
CTATTATCCA TTGTTTATTT AACGGGTTCT TATAGTTCAC CTAAAGCGGG TTCACTCAGT 
AATCGCTACG GGCGAGGCCT AATTTTATTG GCCTCTATCG GTATGATGTT GGTTGGTGTT 
GTGATCACCA GTTTTCCGTC AGTGATCATG ATTTTTATTG GTATGATGTT CGTTGCAGCA 
GGATTCTTTG CCGCTCACTC CGTTGTCAGT AGCTGGGTTG GTTGCAGAGC ACGTCGTGCT 
AAGGCACAAG CTTCGTCACT TTATCTGTTT TGTTACTATG CCGGTTCCAG CGTAGCCGGT 
ACGTTAGGTG GCGTTTTTTG GTTACATTTA GGCTGGACAG GTGTTGTTGT TTTTATTACC 
GCCCTTTTAG TTATCGCGTT GTTTATCGCT CAGCGATTAC GAAAGTTGGT AGGAACAGCC 
AAGCGTTGA

Protein sequence

MAPASTKNDD DTVFTTIPKL PPLNKRPYIQ QGTPEFIRVA LALFSAGLAT FALLYCVQPI 
LPMLSQDFST SPASSSLSLS IATGMLALGL MFTGPLSDAI GRKSVMVVAL LLAAVCTIVC 
SFMTSWHGIL LMRALTGLSL SGVAAVAMTY LSEEIHPNFI ALSMGLYISG SSIGGMSGRL 
VAGVLSDLFS WRVSLLVLGL FALAAACLFW FILPASKHFR ASSLRPRTLL INFKLHWRDS 
GLPLLFAEGF LIMGGFVTLF NYIGYRLLDG PYYLSPTIVG LLSIVYLTGS YSSPKAGSLS 
NRYGRGLILL ASIGMMLVGV VITSFPSVIM IFIGMMFVAA GFFAAHSVVS SWVGCRARRA 
KAQASSLYLF CYYAGSSVAG TLGGVFWLHL GWTGVVVFIT ALLVIALFIA QRLRKLVGTA 
KR