Gene YpsIP31758_4161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4161
Symbol
ID	5388184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4697020
End bp	4698348
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	50%
IMG OID	640867189
Product	AzgA family purine transporter
Protein accession	YP_001403103
Protein GI	153948181
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.241199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAT CAAACCTTGA TACCGAGCAG GGCCTGCTCG AACGTGTATT TAAACTGAAA 
CAGCATGGCA CCACAGCTCG TACTGAGTTG ATTGCGGGTA TCACGACTTT CTTGACCATG 
GTCTATATCG TATTCGTAAA CCCGCAGATT CTCGGGGTTG CGGGTATGGA TGTGCAGGCG 
GTGTTCGTGA CAACCTGCCT GATCGCCGCA TTTGGCAGCA TTTTTATGGG CTTATTGGCT 
AACTTACCTG TGGCACTGGC ACCGGCGATG GGGCTTAACG CTTTCTTCGC TTTTGTGGTG 
GTAGGGGCGA TGGGTATTTC TTGGCAGGTC GGTATGGGCG CTATTTTCTG GGGGGCAATC 
GGTTTCCTTT TGCTAACCAT TTTCCGCATT CGTTACTGGA TGATAGCGAA CATCCCACTG 
AGCCTGCGTG TGGGGATCAC AAGTGGTATT GGCCTGTTTA TTGCCATGAT GGGGTTGAAG 
AATGCCGGTA TCGTGGTTGC AAACCCAGAT ACACTGGTGG CGGTGGGTAA TCTGACCTCT 
CACAGTGTAC TGTTGGGTGC ACTGGGTTTC TTTATTATCG CAGTCTTGGC TTCTCGTAAT 
ATTCACGCGG CAGTGCTGGT TTCTATTGTG GTTACCACAC TGATTGGCTG GGCGCTGGGT 
GATGTGCATT ATTCGGGCAT TTTCTCCATG CCACCAAGTG TGACTTCTGT GGTTGGGCAG 
GTTGATTTAG CTGGCGCGTT GAATATTGGT ATGGCGGGTA TTATTTTCTC CTTCATGCTG 
GTTAACCTGT TTGATTCATC CGGCACATTG ATTGGTGTCA CGGATAAAGC CGGTTTAGCG 
GATCATAAAG GCAAGTTTCC GCGCATGAAA CAAGCGCTGT ATGTGGACAG TATCAGCTCC 
GTTGCCGGTG CTTTTATTGG TACTTCATCA GTGACCGCGT ATATCGAAAG TTCTTCCGGG 
GTATCTGTTG GCGGCCGTAC CGGGTTAACC GCTGTTGTTG TCGGGATACT CTTCCTGCTG 
GTGATATTTA TTTCTCCGTT GGCGGGTATG GTTCCTGCGT ATGCGGCCGC GGGCGCGCTG 
ATTTATGTTG GTGTGTTGAT GACATCTAGC CTGGCACGGG TGAAGTGGGA TGATTTGACT 
GAAGCCGTTC CAGCCTTTGT CACGGCTGTC ATGATGCCGT TCAGTTTCTC TATCACTGAA 
GGGATCGCAC TGGGCTTTAT CTCTTATTGT TTGATGAAGT TAGGTACTGG CCGCTGGCGT 
GAAATCAGCC CTTGCGTAGT GGTAGTGGCG CTACTGTTTA TGCTGAAAAT TGCGTTTGTT 
GATCACTGA

Protein sequence

MSKSNLDTEQ GLLERVFKLK QHGTTARTEL IAGITTFLTM VYIVFVNPQI LGVAGMDVQA 
VFVTTCLIAA FGSIFMGLLA NLPVALAPAM GLNAFFAFVV VGAMGISWQV GMGAIFWGAI 
GFLLLTIFRI RYWMIANIPL SLRVGITSGI GLFIAMMGLK NAGIVVANPD TLVAVGNLTS 
HSVLLGALGF FIIAVLASRN IHAAVLVSIV VTTLIGWALG DVHYSGIFSM PPSVTSVVGQ 
VDLAGALNIG MAGIIFSFML VNLFDSSGTL IGVTDKAGLA DHKGKFPRMK QALYVDSISS 
VAGAFIGTSS VTAYIESSSG VSVGGRTGLT AVVVGILFLL VIFISPLAGM VPAYAAAGAL 
IYVGVLMTSS LARVKWDDLT EAVPAFVTAV MMPFSFSITE GIALGFISYC LMKLGTGRWR 
EISPCVVVVA LLFMLKIAFV DH