Gene YpsIP31758_1993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1993
Symbol
ID	5386430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	2294953
End bp	2296071
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	51%
IMG OID	640864977
Product	integral membrane protein
Protein accession	YP_001400966
Protein GI	153947451
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.191087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATGGT ATGATGGACT ACGGCATCCG GGTGTATTGG CGGCATTGTC TGCTGCAATA 
CTGTTTGGTG CCGGTACCCC TCTGGCAAAA CAATTACTGA ATACCGTTAG CCCCTGGTTA 
TTGGCCGGTT TACTTTACCT TGGCTCGGGT ATTGGCTTAA CACTCTACCG TTTGATCACT 
CGCCCGGCGG CGGTGAGCCT GCCCCGTAAT GAATTATTGT GGTTTATTGG TGCCATCCTC 
TCCGGGGGGA TCATCGCACC CGTGCTGCTA ATGGTCGGCC TCACGGGTAT GCCCGCCTCT 
GGCGCATCAC TGTTACTCAA TGCTGAAGGG GTATTCACCG CCCTTTTAGC CTGGTTTGCC 
TTCAAAGAGA ATGTTGACCG TCGTATTGCT CTGGGGATGG TGATTATCAT CGCTGGCGCA 
GTTGTGCTTA GCTGGCCAGA AGAAGTACTT AACTGGTGGC CAAAAGAGGC TCAATTTGCC 
GGATTATGGC CGACGCTGGC CATTTTAGGT GCCTGCTTTG CCTGGGGAAT TGATAACAAT 
CTGACCCGTA AAGTCTCGCT GAACGATGCA ACCTGGATTG CCGCCGTCAA AGGGGGCGTT 
GCCGGAGTGG TTAATCTGGC GCTGGCCTTC GCCCTCGGAG CAACATTGCC CCCTTTGGCA 
AATCTCGCTG GCGCATTGTT GGTTGGATTT TTGGCTTATG GTGTCAGTTT GGCGCTATTT 
GTCATTGGAT TACGTCACCT CGGTACTGCC CGCACCGGTG CCTATTTTTC TATTGCTCCG 
TTCTTAGGCG CAGTGTTGGC TGTCGCCTTA GGTGACACTG TCACCATTCC GTTGCTCATC 
GCGGGTATTT TGATGGCGAT AGGGATCGGG TTACATCTTA CGGAGCAGCA TGAACATCAA 
CATACCCATG ATGAAATGAT ACATGAGCAT GAACATATTC ATGACGAACA TCATCAACAT 
CGCCATGACT TTCCGGTAGA CGCGGGTACC GCGCATAAGC ATCGTCATCA GCACCTACCG 
ATGGCACACT CTCATTCGCA TTTTCCTGAT TCACACCATC AGCATAAACA TCCTCGACAT 
AAGCATAATC AACATAAGTA TCATCAACAT AAGCACTAG

Protein sequence

MKWYDGLRHP GVLAALSAAI LFGAGTPLAK QLLNTVSPWL LAGLLYLGSG IGLTLYRLIT 
RPAAVSLPRN ELLWFIGAIL SGGIIAPVLL MVGLTGMPAS GASLLLNAEG VFTALLAWFA 
FKENVDRRIA LGMVIIIAGA VVLSWPEEVL NWWPKEAQFA GLWPTLAILG ACFAWGIDNN 
LTRKVSLNDA TWIAAVKGGV AGVVNLALAF ALGATLPPLA NLAGALLVGF LAYGVSLALF 
VIGLRHLGTA RTGAYFSIAP FLGAVLAVAL GDTVTIPLLI AGILMAIGIG LHLTEQHEHQ 
HTHDEMIHEH EHIHDEHHQH RHDFPVDAGT AHKHRHQHLP MAHSHSHFPD SHHQHKHPRH 
KHNQHKYHQH KH