Gene EcSMS35_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1047
Symbol
ID	6145361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1067134
End bp	1068192
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	641615934
Product	YeeE/YedE family membrane protein
Protein accession	YP_001743126
Protein GI	170680499
COG category	[R] General function prediction only
COG ID	[COG2391] Predicted transporter component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.588627
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.12651
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCAA TGATATTAAG CGGGCTAATT TGTGGTGCTC TGCTGGGATT TGTCATGCAG 
CGTGGGCGTT TTTGCCTGAC AGGTGGTTTT CGCGATATGT ATGTCGCGAA AAATAATCGC 
ATGTTTTACG CCTTGCTGAT TGCAATTTCG GTACAAAGCG TGGGGGTTTT TGCGTTAATT 
CAGGCGGGCC TACTGACTTA CGAAGCCGGG GCGTTCCCGT GGCTTGGTAC TGTTATAGGT 
GGGTATCTTT TCGGGCTGGG AATTGTTCTG GCGGGTGGAT GTGCCACCGG GACCTGGTAT 
CGCGCGGGTG AGGGATTGAT CGGCAGTTGG ATCGCGCTTT TCACTTATAT GGTGATGAGT 
GCGGTGATGC GTTCTCCACA CGCCAGTGGT TTAAATCAAA CCTTGCAGCA CTACACTACT 
GAACATAACT CTATTGCTGA TACTTTTAAT TTGTCTGTGT GGCCGTTGGT TGCCGTTTTG 
CTGGTGATAA CGCTCTGGGT GGTGATGAAA GAGTTGAAGA AGCCAAAACT CAAAGTCGCG 
ACCTTACCGC CGCGCCGAAC CGGGATCGCT CATATTCTGT TTGAAAAACG CTGGCATCCC 
TTTGTCACAG CTGTACTCAT CGGTTTGATT GCGCTTTTAG CCTGGCCCCT GAGTGAAGCA 
ACCGGACGTA TGTTTGGGTT AGGCATCACT TCCCCAACGG CCAATATTCT GCAATTTCTG 
GTCGCGGGTG ACGTGAAATA CATTAACTGG GGCGTTTTCC TGGTGTTAGG GAGCTTCGTG 
GGGTCATTTA TTGCCGCCAA AGCGAGCCGT GAGTTCCGCG TTCGCGCTGC TGATGCACAA 
ACAACATTAC GTAGCGGGTT AGGTGGTGTA CTGATGGGCT TCGGTGCCAG CATTGCAGGT 
GGTTGCTCTA TCGGTAATGG ACTGGTCATG ACTGCAATGA TGACCTGGCA GGGCTGGATT 
GGCCTTGTAT TTATGATTCT CGGAGTCTGG ACTGCGTCCT GGCTTGTGTA TGTTCGACCG 
CAGCGTAAGG CGCGACTGGC AACTGCTGCG GCAAATTAA

Protein sequence

MFSMILSGLI CGALLGFVMQ RGRFCLTGGF RDMYVAKNNR MFYALLIAIS VQSVGVFALI 
QAGLLTYEAG AFPWLGTVIG GYLFGLGIVL AGGCATGTWY RAGEGLIGSW IALFTYMVMS 
AVMRSPHASG LNQTLQHYTT EHNSIADTFN LSVWPLVAVL LVITLWVVMK ELKKPKLKVA 
TLPPRRTGIA HILFEKRWHP FVTAVLIGLI ALLAWPLSEA TGRMFGLGIT SPTANILQFL 
VAGDVKYINW GVFLVLGSFV GSFIAAKASR EFRVRAADAQ TTLRSGLGGV LMGFGASIAG 
GCSIGNGLVM TAMMTWQGWI GLVFMILGVW TASWLVYVRP QRKARLATAA AN