Gene EcSMS35_4742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4742
Symbol
ID	6146358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4841167
End bp	4842267
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	641619557
Product	putative permease
Protein accession	YP_001746665
Protein GI	170681521
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000002134
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.891327
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAATCA TAAGATATCT GGTGCGGGAG ACGCTCAAAA GCCAGCTGGC GATACTCTTC 
ATCTTGCTTT TGATCTTCTT CTGTCAAAAG TTAGTGAGGA TCCTCGGCGC AGCGGTTGAC 
GGCGATATTC CGGCGAATCT GGTGCTCTCC CTTCTCGGGT TGGGCGTGCC GGAAATGGCG 
CAGCTTATCC TGCCATTAAG CCTGTTCCTC GGGCTGCTGA TGACGCTGGG CAAACTGTAT 
ACCGAAAGTG AAATTACGGT AATGCATGCC TGCGGCCTGA GCAAAGCGGT GCTGGTGAAA 
GCGGCAATGA TCCTTGCGGT ATTCACGGCA ATCGTCGCGG CGGTTAACGT GATGTGGGCG 
GGACCGTGGT CATCGCGTCA TCAGGATGAA GTGTTAGCAG AAGCGAAAGC GAACCCTGGC 
ATGGCGGCGC TTGCGCAAGG GCAATTCCAG CAAGCGACTA ATGGCAGCTC GGTGCTGTTC 
ATCGAAAGCG TTGACGGCAG CGATTTCAAA GATGTGTTCC TCGCGCAAAT TCGACCAAAA 
GGTAATGCAC GACCTTCTGT GGTGGTGGCC GATTCCGGAC ATTTAACCCA GCTGCGCGAC 
GGCTCCCAGG TCGTCACTCT CAACCAGGGA ACGCGCTTCG AAGGCACTGC ACTGTTACGT 
GATTTCCGCA TTACGGATTT CCAGGATTAT CAGGCGATCA TTGGTCACCA GGCGGTGGCG 
CTCGACCCGA ACGATACCGA CCAGATGGAC ATGCGCACAT TGTGGAACAC TGACACCGAT 
CGTGCTCGCG CAGAACTGAA CTGGCGTATC ACGTTGGTGT TCACCGTGTT TATGATGGCA 
CTTATGGTCG TACCGCTGAG CGTGGTTAAC CCGCGTCAGG GACGCGTACT ATCGATGCTG 
CCAGCCATGC TGCTGTATCT GTTGTTCTTC CTGATCCAGA CCTCCCTGAA ATCGAACGGC 
GGTAAAGGTA AGCTGGACCC GACGCTGTGG ATGTGGACCG TTAACCTGAT TTATCTGGCT 
TTGGCGATTG TTCTCAACCT TTGGGACACC GTGCCGGTCC GCCGCCTGCG CGCCAGTTTT 
TCGCGTAAAG GAGCGGTGTG A

Protein sequence

MIIIRYLVRE TLKSQLAILF ILLLIFFCQK LVRILGAAVD GDIPANLVLS LLGLGVPEMA 
QLILPLSLFL GLLMTLGKLY TESEITVMHA CGLSKAVLVK AAMILAVFTA IVAAVNVMWA 
GPWSSRHQDE VLAEAKANPG MAALAQGQFQ QATNGSSVLF IESVDGSDFK DVFLAQIRPK 
GNARPSVVVA DSGHLTQLRD GSQVVTLNQG TRFEGTALLR DFRITDFQDY QAIIGHQAVA 
LDPNDTDQMD MRTLWNTDTD RARAELNWRI TLVFTVFMMA LMVVPLSVVN PRQGRVLSML 
PAMLLYLLFF LIQTSLKSNG GKGKLDPTLW MWTVNLIYLA LAIVLNLWDT VPVRRLRASF 
SRKGAV