Gene EcSMS35_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2010
Symbol	lolC
ID	6144115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2029884
End bp	2031083
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	55%
IMG OID	641616886
Product	outer membrane-specific lipoprotein transporter subunit LolC
Protein accession	YP_001744062
Protein GI	170683814
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID	[TIGR02212] lipoprotein releasing system, transmembrane protein, LolC/E family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.366068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0307144
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCAAC CTGTCGCTCT ATTTATTGGC CTGCGTTACA TGCGTGGGCG TGCAGCGGAT 
CGCTTCGGTC GTTTCGTCTC CTGGCTTTCT ACCATCGGCA TTACCCTCGG GGTGATGGCG 
CTGGTCACAG TATTGTCAGT GATGAACGGC TTTGAGCGCG AGCTGCAAAA CAACATCCTT 
GGCCTGATGC CACAGGCAAT TCTCTCTTCT GAGCATGGCT CTCTTAACCC GCAGCAACTC 
CCGGAAACGG CAGTCAAACT GGACGGCGTT AATCGCGTCG CACCTATTAC TACCGGTGAT 
GTGGTACTGC AAAGCGCGCG CAGCGTGGCG GTCGGGGTGA TGCTGGGTAT CGACCCGGCG 
CAAAAAGATC CACTAACGCC GTATCTGGTC AATGTGAAAC AAACTGACCT CGAGCCGGGG 
AAATATAATG TCATCCTCGG TGAACAGCTT GCCTCACAGT TGGGCGTCAA TCGCGGTGAT 
CAAATCCGCG TGATGGTGCC ATCTGCCAGC CAGTTCACGC CGATGGGGCG TATTCCAAGC 
CAGCGCCTGT TCAATGTGAT TGGCACTTTC GCCGCCAACA GTGAAGTCGA TGGCTATGAA 
ATGCTGGTGA ATATTGAGGA TGCCTCGCGT CTGATGCGTT ATCCGGCAGG CAATATTACC 
GGCTGGCGTT TGTGGCTGGA TGAGCCGCTG AAAGTCGACT CATTAAGTCA GCAAAAACTG 
CCTGAAGGCA GCAAATGGCA GGACTGGCGT GACCGTAAAG GCGAGCTTTT CCAGGCCGTA 
CGCATGGAAA AAAATATGAT GGGCTTACTG CTGAGCCTGA TTGTCGCCGT TGCGGCGTTT 
AACATTATTA CCTCGCTAGG GCTGATGGTG ATGGAGAAGC AGGGCGAAGT AGCGATCCTG 
CAAACGCAAG GCTTAACTCC GCGACAAATC ATGATGGTCT TTATGGTGCA AGGGGCCAGC 
GCTGGGATTA TCGGTGCGAT CCTCGGAGCG GCGCTTGGCG CACTGCTTGC CAGCCAGTTG 
AATAATCTGA TGCCGATAAT CGGCGTCCTG CTTGATGGCG CGGCGCTGCC GGTCGCTATC 
GAACCTTTAC AGGTCATTGT TATTGCGCTG GTGGCGATGG CTATCGCGCT GCTGTCTACG 
CTTTACCCTT CATGGCGCGC TGCCGCCACT CAACCCGCTG AGGCTTTACG TTATGAATAA

Protein sequence

MYQPVALFIG LRYMRGRAAD RFGRFVSWLS TIGITLGVMA LVTVLSVMNG FERELQNNIL 
GLMPQAILSS EHGSLNPQQL PETAVKLDGV NRVAPITTGD VVLQSARSVA VGVMLGIDPA 
QKDPLTPYLV NVKQTDLEPG KYNVILGEQL ASQLGVNRGD QIRVMVPSAS QFTPMGRIPS 
QRLFNVIGTF AANSEVDGYE MLVNIEDASR LMRYPAGNIT GWRLWLDEPL KVDSLSQQKL 
PEGSKWQDWR DRKGELFQAV RMEKNMMGLL LSLIVAVAAF NIITSLGLMV MEKQGEVAIL 
QTQGLTPRQI MMVFMVQGAS AGIIGAILGA ALGALLASQL NNLMPIIGVL LDGAALPVAI 
EPLQVIVIAL VAMAIALLST LYPSWRAAAT QPAEALRYE