Gene EcSMS35_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1054
Symbol
ID	6144474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1072068
End bp	1073126
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	641615940
Product	hypothetical protein
Protein accession	YP_001743132
Protein GI	170681607
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.205497
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTGCCG ATAAGTCATT AAGCCCGTTT GAAATCCGGG TATACCGCCA TTACCGCATT 
GTGCATGGTA CTCGGGTCGC GCTGGCATTC CTGCTCACTT TTCTCATTAT CCGCCTGTTT 
ACTATCCCGG AAAGCACCTG GCCGCTGGTC ACCATGGTGG TGATTATGGG GCCAATCTCG 
TTCTGGGGGA ACGTTGTCCC TCGTGCCTTC GAACGTATTG GCGGTACGGT GTTGGGTTCG 
ATTTTAGGTC TTATCGCTCT GCAACTGGAG TTAATTTCGT TACCGCTGAT GTTAGTCTGG 
TGCGCGGCGG CGATGTTTCT TTGCGGTTGG CTGGCGCTGG GCAAGAAACC GTATCAAGGA 
TTATTGATTG GGGTGACGCT GGCAATTGTT GTGGGTTCCC CGACAGGTGA AATTGATACG 
GCGTTATGGC GAAGCGGCGA TGTGATCCTC GGCTCTTTAC TGGCAATGTT GTTTACCGGT 
ATCTGGCCAC AACGGGCGTT CATCCACTGG CGCATTCAAC TGGCGAAAAG TCTGACCGAG 
TATAATCGGG TCTATCAATC TGCATTCTCA CCGAACTTAC TCGAACGCCC ACGTCTGGAA 
AGCCATCTAC AAAAACTGCT GACCGATGCC GTGAAAATGC GTGGGCTGAT TGCGCCCGCC 
AGCAAAGAAA CCCGTATTCC AAAATCGATA TATGAAGGTA TCCAGACCAT TAACCGCAAT 
CTGGTTTGTA TGCTGGAGTT GCAAATCAAT GCATACTGGG CCACGCGCCC CAGCCATTTC 
GTGTTATTGA ACGCGCAAAA ACTTCGTGAT ACCCAGCACA TGATGCAGCA AATACTGCTG 
AGCCTTGTTC ATGCGCTGTA CGAAGGTAAT CCGCAGCCGG TTTTTGCCAA TACGGAAAAA 
TTGAACGATG CTGTGGAAGA GCTGCGTCTG TTGCTTAATA ACCACCATGA CCTGAAGGTT 
GTGGAAACAC CAATCTATGG TTATGTGTGG CTGAACATGG AAACGGCGCA TCAGCTTGAG 
TTGCTATCGA ATCTGATTTG CCGGGCCTTG CGCAAATAA

Protein sequence

MRADKSLSPF EIRVYRHYRI VHGTRVALAF LLTFLIIRLF TIPESTWPLV TMVVIMGPIS 
FWGNVVPRAF ERIGGTVLGS ILGLIALQLE LISLPLMLVW CAAAMFLCGW LALGKKPYQG 
LLIGVTLAIV VGSPTGEIDT ALWRSGDVIL GSLLAMLFTG IWPQRAFIHW RIQLAKSLTE 
YNRVYQSAFS PNLLERPRLE SHLQKLLTDA VKMRGLIAPA SKETRIPKSI YEGIQTINRN 
LVCMLELQIN AYWATRPSHF VLLNAQKLRD TQHMMQQILL SLVHALYEGN PQPVFANTEK 
LNDAVEELRL LLNNHHDLKV VETPIYGYVW LNMETAHQLE LLSNLICRAL RK