Gene YpsIP31758_2762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2762
Symbol
ID	5387346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	3115016
End bp	3116170
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	50%
IMG OID	640865755
Product	major facilitator transporter
Protein accession	YP_001401726
Protein GI	153949416
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.00913666
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCA AAATACACCA ACAAGCAGTA CAGCCCGGTA TTAGCCAACA AGTTTCTACC 
CGGTTAGCTT TTTTTATTGC CGGGTTAGGC ATGGCCGCTT GGGCACCACT TGTTCCCTTT 
GCAAAAGCGC GCATTGGTCT TAATGATGCC TCATTGGGTT TATTACTGTT ATGCATTGGT 
ATTGGATCGA TGCTGGCGAT GCCGCTCACT GGCGTGCTTA CCGCGAAGTG GGGCTGTCGG 
GCCGTCATTT TACTGGCAGG CGCAGTGCTC TGTTTAGATT TGCCTTTACT CGTATTGATG 
AATACTCCCG CGACGATGGC TATCGCACTA TTAGTATTCG GTGCAGCTAT GGGCATAATA 
GATGTGGCGA TGAACATTCA GGCTGTCATT GTTGAAAAAG CCAGTGGCCG GGCGATGATG 
TCTGGCTTCC ACGGTTTATT CAGTGTCGGT GGGATTGTTG GTGCAGGAGG TGTCAGTGCT 
CTATTGTGGC TAGGCCTCAA CCCACTGACA GCGATTATGG CTACCGTAGT ACTCATGATT 
ATTTTGCTGC TGGCAGCCAA TAAGAATCTG TTACGTGGCA GCGGTGAACC CCATGATGGG 
CCATTGTTTG TTTTTCCCCG TGGCTGGGTG ATGTTCATCG GCTTTTTATG TTTTGTCATG 
TTTTTGGCAG AAGGCTCGAT GCTTGACTGG AGTGCCGTCT TCCTGACGAC GCTACGCGGC 
ATGTCGCCAT CACAAGCAGG TATGGGCTAC GCCGTATTCG CCATCGCTAT GACACTTGGC 
CGCCTAAACG GTGATCGGAT TGTCAATGGG CTGGGCCGTT ACAAGGTCTT ATTAGGTGGC 
AGTTTATGTT CTGCCATCGG GATTATTATC GCAATCAGTA TTGATAGCTC AATGGCTGCC 
ATTATTGGCT TCATGTTAGT GGGTTTCGGC GCATCGAATG TGGTACCGAT CTTGTTTACC 
GCCGCAGGTA ATCAAACCGT TATGCCTGCC AACCTGGCGG TTGCGTCAAT TACAACGATC 
GGTTACGCGG GAATTTTGGC TGGCCCGGCA GCTATCGGCT TTATTGCACA ATTAAGTAGT 
CTATCGGTTG CTTTTGGCTG TGTAGCACTT CTGTTATTAA CCGTTGCTGC CAGCGCCAGA 
GCCGTCACGC GCTAA

Protein sequence

MSTKIHQQAV QPGISQQVST RLAFFIAGLG MAAWAPLVPF AKARIGLNDA SLGLLLLCIG 
IGSMLAMPLT GVLTAKWGCR AVILLAGAVL CLDLPLLVLM NTPATMAIAL LVFGAAMGII 
DVAMNIQAVI VEKASGRAMM SGFHGLFSVG GIVGAGGVSA LLWLGLNPLT AIMATVVLMI 
ILLLAANKNL LRGSGEPHDG PLFVFPRGWV MFIGFLCFVM FLAEGSMLDW SAVFLTTLRG 
MSPSQAGMGY AVFAIAMTLG RLNGDRIVNG LGRYKVLLGG SLCSAIGIII AISIDSSMAA 
IIGFMLVGFG ASNVVPILFT AAGNQTVMPA NLAVASITTI GYAGILAGPA AIGFIAQLSS 
LSVAFGCVAL LLLTVAASAR AVTR