Gene EcSMS35_3264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3264
Symbol
ID	6144368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3342864
End bp	3343943
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	52%
IMG OID	641618094
Product	YjgP/YjgQ permease
Protein accession	YP_001745244
Protein GI	170681358
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.917388
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTTT TCAGTCGCTA TTTAATCCGT CATCTCTTTC TCGGTTTTGC CGCCGCCGCA 
GGGCTATTGC TGCCGCTTTT TACCACCTTC AACCTGATTA ACGAACTGGA TGATGTCAGC 
CCGGGCGGTT ATCGCTGGAC TCTGGCGGTG CTGGTGGTGC TGATGACCTT ACCGCGTACA 
CTGGTCGAAC TTTCGCCATT TATCGCATTA TTGGGAGGGA TTGTTGGCCT GGGGCAGTTA 
TCGAAAAACA GTGAGCTTAC CGCCATTCGC AGCACTGGGT TTTCTATCTT CCGTATTGCA 
CTGGTGGCGC TGGTTGCCGG GATATTGTGG ACTGTTTCGT TAGGCGCGAT AGATGAGTGG 
GTGGCGTCGC CATTGCAGCA GCAGGCGCTG CAAATCAAAT CGACTGCCAC CGCGTTGGGG 
GAGGACGATG ACATTACCGG CAATATGCTT TGGGCCAGGC GCGGTAATGA ATTTGTGACG 
GTGAAATCGC TGAACGAGCA GGGCCAGCCT GTGGGCGTGG AGATATTTCA TTATCGCGAC 
GATCTCTCGC TCGAATCCTA CATTTTTGCA CGCAGTGCCT CCATTGAAGA CGACAAAACG 
TGGATCCTGC ATGGTGTGAA TCATAAAAAA TGGTTGAATG GCAAAGAAAC GCTGGAAACA 
TCAGATAATC TTGCCTGGCA ATCGGCCTTC ACCAGTATGG ATCTTGAAGA GTTATCGATG 
CCGGGGAATA CTTTTTCTGT CCGTCAGCTT AATCATTACA TCCATTATTT GCAGGAAACC 
GGACAACCCA GCAGCGAATA CCGCCTTGCA CTGTGGGAAA AACTGGGGCA ACCGATCCTG 
ACCCTGGCGA TGATTTTGCT GGCTGTGCCG TTCACCTTTA GCGCCCCGCG CTCGCCAGGG 
GTGGGTAGCC GTCTCGCTGT AGGCGTCATC GTTGGCTTAC TCACCTGGAT CAGCTATCAA 
ATCATGGTCA ATCTGGGATT GTTATTTGCG TTGAGCGCAC CTGTTACCGC GCTCGGTTTA 
CCGGTAGCGT TTGTGTTGGT GGCGTTGAGC CTGGTGTATT GGTATGACAG ACAACATTAA

Protein sequence

MNVFSRYLIR HLFLGFAAAA GLLLPLFTTF NLINELDDVS PGGYRWTLAV LVVLMTLPRT 
LVELSPFIAL LGGIVGLGQL SKNSELTAIR STGFSIFRIA LVALVAGILW TVSLGAIDEW 
VASPLQQQAL QIKSTATALG EDDDITGNML WARRGNEFVT VKSLNEQGQP VGVEIFHYRD 
DLSLESYIFA RSASIEDDKT WILHGVNHKK WLNGKETLET SDNLAWQSAF TSMDLEELSM 
PGNTFSVRQL NHYIHYLQET GQPSSEYRLA LWEKLGQPIL TLAMILLAVP FTFSAPRSPG 
VGSRLAVGVI VGLLTWISYQ IMVNLGLLFA LSAPVTALGL PVAFVLVALS LVYWYDRQH