Gene EcSMS35_1508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1508
Symbol	ydiK
ID	6144935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1492677
End bp	1493789
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	54%
IMG OID	641616386
Product	putative inner membrane protein
Protein accession	YP_001743566
Protein GI	170680839
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.000188442
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTAAATG TTCGTCAGCC CAGGGATGTC GCACAAATTC TGCTTTCGGT GCTCTTTTTA 
GCCATCATGA TTGTGGCATG TCTGTGGATT GTACAACCCT TTATTCTCGG CTTTGCATGG 
GCTGGTACGG TGGTTATCGC CACCTGGCCG GTATTGTTAC GTTTGCAAAA GTTCATGTTT 
GGTCGCCGCT CTCTCGCCGT TCTGGTGATG ACGCTGTTAT TAGTGATGGT GTTTATCATC 
CCTATTGCCT TGCTGGTTAA CAGTATCGTC GACGGCAGCG GCCCGCTAAT TAAAGCCATT 
TCCAGCGGTG ACATGACGTT ACCCGATCTG GCGTGGCTTA ATACCATTCC GGTGATTGGC 
GCGAAGCTAT ATGCAGGCTG GCACAACTTG CTGGATATGG GGGGGACGGC GATCATGGCA 
AAAGTCCGTC CTTATATTGG CACCACCACC ACCTGGTTCG TTGGGCAGGC GGCGCATATC 
GGGCGCTTTA TGGTGCATTG TGCGCTGATG CTTCTCTTCA GCGCCCTGCT GTACTGGCGC 
GGTGAACAGG TGGCACAAGG CATTCGCCAT TTTGCAACCC GTCTGGCAGG CGTTCGTGGA 
GATGCCGCCG TGCTGCTGGC GGCACAGGCT ATCCGCGCGG TGGCGCTGGG TGTTGTGGTG 
ACAGCGTTAG TACAGGCAGT GCTTGGCGGT ATCGGCCTCG CCGTATCCGG CGTACCTTAT 
GCAACTTTGC TCACGGTGTT AATGATCCTC TCCTGCCTTG TCCAGCTTGG ACCGTTGCCG 
GTACTGATTC CGGCGATTAT CTGGCTCTAC TGGACTGGCG ATACCACCTG GGGAACGGTA 
TTGTTAGTGT GGAGCGGTGT GGTTGGCACG CTGGATAACG TCATCCGCCC AATGTTAATT 
CGCATGGGTG CCGATTTACC GCTGATCCTG ATTCTCTCTG GCGTTATTGG TGGTTTGATT 
GCTTTCGGGA TGATCGGCCT GTTTATTGGT CCGGTTCTGT TAGCCGTTTC CTGGCGTCTT 
TTTGCCGCGT GGGTGGAAGA AGTCCCACCG CCGACGGACC AACCGGAAGA AATTCTCGAA 
GAACTTGGCG AAATCGAGAA ATCGAATAAG TAA

Protein sequence

MVNVRQPRDV AQILLSVLFL AIMIVACLWI VQPFILGFAW AGTVVIATWP VLLRLQKFMF 
GRRSLAVLVM TLLLVMVFII PIALLVNSIV DGSGPLIKAI SSGDMTLPDL AWLNTIPVIG 
AKLYAGWHNL LDMGGTAIMA KVRPYIGTTT TWFVGQAAHI GRFMVHCALM LLFSALLYWR 
GEQVAQGIRH FATRLAGVRG DAAVLLAAQA IRAVALGVVV TALVQAVLGG IGLAVSGVPY 
ATLLTVLMIL SCLVQLGPLP VLIPAIIWLY WTGDTTWGTV LLVWSGVVGT LDNVIRPMLI 
RMGADLPLIL ILSGVIGGLI AFGMIGLFIG PVLLAVSWRL FAAWVEEVPP PTDQPEEILE 
ELGEIEKSNK