Gene EcSMS35_2008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2008
Symbol	lolE
ID	6146219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2027946
End bp	2029190
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	52%
IMG OID	641616884
Product	outer membrane-specific lipoprotein transporter subunit LolE
Protein accession	YP_001744060
Protein GI	170682380
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID	[TIGR02212] lipoprotein releasing system, transmembrane protein, LolC/E family [TIGR02213] lipoprotein releasing system, transmembrane protein LolE

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0630458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATGC CTTTATCGTT ATTAATTGGC CTGCGTTTTA GTCGCGGACG GCGGCGCGGC 
GGCATGGTGT CGCTGATCTC CGTCATTTCT ACCATCGGCA TTGCCCTCGG CGTGGCGGTA 
TTGATCGTCG GCTTAAGCGC GATGAACGGC TTTGAACGCG AACTGAATAA CCGCATTCTG 
GCGGTGGTGC CGCATGGTGA AATCGAAGCG GTGGATCAGC CGTGGACTAA CTGGCAGGAA 
GCACTGGATA ACGTGCAGAA AGTGCCGGGT ATTGCCGCCG CTGCGCCGTA TATCAATTTC 
ACCGGGCTGG TGGAAAGTGG CGCGAATCTG CGCGCAATCC AGGTGAAGGG CGTTAACCCG 
CAACAGGAAC AGCGTCTGAG CGCATTACCC TCGTTTGTTC AGGGGGATGC CTGGCGCAAT 
TTTAAAGCGG GCGAACAGCA AATTATCATC GGCAAAGGCG TGGCGGATGC GCTGAAAGTG 
AAGCAGGGCG ATTGGGTGTC GATTATGATC CCCAACTCGA ATCCTGAGCA TAAACTGATG 
CAGCCAAAAC GTGTGCGTTT GCACGTTGCC GGTATTTTGC AGTTGAGTGG TCAACTCGAT 
CACAGTTTTG CCATGATCCC GCTGGCGGAT GCCCAACAAT ATCTTGATAT GGGTTCCAGC 
GTGTCAGGTA TTGCCCTTAA AATGACGGAT GTTTTCAACG CCAATAAGCT GGTACGCGAT 
GCGGGTGAAG TGACCAACAG CTATGTTTAT ATTAAAAGCT GGATTGGTAC TTACGGCTAT 
ATGTATCGCG ATATCCAGAT GATCCGCGCC ATTATGTATC TGGCGATGGT ACTGGTGATT 
GGCGTGGCCT GTTTCAACAT CGTCTCCACC TTAGTGATGG CGGTGAAAGA CAAGAGTGGC 
GATATCGCAG TATTAAGAAC GCTGGGGGCG AAAGATGGTT TAATTCGCGC CATCTTTGTC 
TGGTATGGAT TGCTGGCAGG GCTGTTCGGC AGCCTGTGTG GGGTGATTAT CGGCGTAGTG 
GTTTCACTGC AACTTACCCC GATTATTGAG TGGATTGAAA AGCTGATCGG TCATCAGTTC 
CTCTCCAGCG ATATCTATTT TATTGACTTC TTGCCATCGG AATTGCACTG GCTGGACGTC 
TTCTACGTAC TGGTCACAGC ATTGTTGCTG AGTCTTTTGG CAAGTTGGTA TCCGGCGCGG 
CGCGCCAGTA ATATTGACCC TGCGCGAGTC CTTAGCGGCC AGTAA

Protein sequence

MAMPLSLLIG LRFSRGRRRG GMVSLISVIS TIGIALGVAV LIVGLSAMNG FERELNNRIL 
AVVPHGEIEA VDQPWTNWQE ALDNVQKVPG IAAAAPYINF TGLVESGANL RAIQVKGVNP 
QQEQRLSALP SFVQGDAWRN FKAGEQQIII GKGVADALKV KQGDWVSIMI PNSNPEHKLM 
QPKRVRLHVA GILQLSGQLD HSFAMIPLAD AQQYLDMGSS VSGIALKMTD VFNANKLVRD 
AGEVTNSYVY IKSWIGTYGY MYRDIQMIRA IMYLAMVLVI GVACFNIVST LVMAVKDKSG 
DIAVLRTLGA KDGLIRAIFV WYGLLAGLFG SLCGVIIGVV VSLQLTPIIE WIEKLIGHQF 
LSSDIYFIDF LPSELHWLDV FYVLVTALLL SLLASWYPAR RASNIDPARV LSGQ