Gene EcHS_A3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3159
Symbol
ID	5593631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3172316
End bp	3173395
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	51%
IMG OID	640922279
Product	YjgP/YjgQ permease
Protein accession	YP_001459777
Protein GI	157162459
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTT TCAGTCGCTA TTTAATCCGT CATCTCTTTC TCGGTTTTGC CGCCGCCGCA 
GGGCTATTGC TGCCGCTTTT TACCACCTTC AACCTGATTA ACGAACTGGA TGATGTCAGC 
CCGGGCGGTT ATCGCTGGAC TCAAGCGGTG CTGGTGGTGC TAATGACCTT ACCGCGCACA 
CTGGTCGAAC TTTCGCCGTT TATCGCCTTA TTGGGAGGGA TTGTTGGCCT GGGGCAGTTA 
TCGAAAAACA GTGAGCTTAC CGCCATTCGC AGCACGGGGT TTTCTATCTT CCGTATTGCA 
CTGGTGGCGC TGGTTGCCGG GATATTGTGG ACTGTTTCGT TAGGCGCGAT AGATGAGTGG 
GTGGCGTCGC CATTGCAGCA ACAGGCGCTG CAAATCAAAT CGACCGCCAC CGCGTTGGGG 
GAGGACGATG ACATTACCGG CAATATGCTG TGGGCCAGGC GCGGCAATGA ATTTGTGACG 
GTGAAATCGC TGAATGAACA GGGCCAGCCT GTGGGCGTGG AGATTTTTCA TTATCGTGAC 
GATCTTTCGC TCGAATCCTA CATTTATGCA CGCAGTGCCA CCATTAAAGA CGACAAAACG 
TGGATCCTGC ATGGTGTGAA TCATAAAAAA TGGCTTAACG GTAAAGAAAC GCTGGAAACA 
TCAGATAATC TTGCCTGGCA ATCGGCCTTC ACCAGTATGG ATCTTGATGA GTTATCGATG 
CCGGGGAATA CTTTTTCTGT CCGTCAGCTT AATCATTACA TCCATTATTT GCAGGAAACC 
GGGCAACCCA GCAGCGAATA CCGCCTTGCA CTGTGGGAAA AACTGGGGCA ACCGATCCTG 
ACCCTGGCGA TGATTTTGCT GGCTGTGCCG TTTACCTTTA GCGCCCCGCG CTCGCCAGGG 
ATGGGTAGCC GTCTCGCTGT AGGCGTCATC GTTGGCTTAC TCACCTGGAT CAGCTATCAA 
ATCATGGTCA ATTTGGGATT GCTATTTGCG TTAAGCGCAC CTGTTACCGC GCTCGGTTTA 
CCGGTAGCGT TTGTGTTGGT GGCGTTGAGC CTGGTGTATT GGTATGACAG ACAACATTAA

Protein sequence

MNVFSRYLIR HLFLGFAAAA GLLLPLFTTF NLINELDDVS PGGYRWTQAV LVVLMTLPRT 
LVELSPFIAL LGGIVGLGQL SKNSELTAIR STGFSIFRIA LVALVAGILW TVSLGAIDEW 
VASPLQQQAL QIKSTATALG EDDDITGNML WARRGNEFVT VKSLNEQGQP VGVEIFHYRD 
DLSLESYIYA RSATIKDDKT WILHGVNHKK WLNGKETLET SDNLAWQSAF TSMDLDELSM 
PGNTFSVRQL NHYIHYLQET GQPSSEYRLA LWEKLGQPIL TLAMILLAVP FTFSAPRSPG 
MGSRLAVGVI VGLLTWISYQ IMVNLGLLFA LSAPVTALGL PVAFVLVALS LVYWYDRQH