Gene EcSMS35_2624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2624
Symbol
ID	6142685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2682111
End bp	2683145
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	55%
IMG OID	641617495
Product	lipoprotein
Protein accession	YP_001744660
Protein GI	170682569
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3317] Uncharacterized lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTACT CTGTTCAAAA GTCGCGCCTG GCAAAGGTTG CGGGTGTTTC GCTTGTTTTA 
TTACTCGCTG CCTGTAGTTC TGACTCACGC TATAAGCGTC AGGTCAGTGG TGATGAAGCC 
TACCTGGAAG CGGCACCGCT TGCGGAGCTT CATGCCCCGG CTGGAATGAT TTTGCCGGTG 
ACCTCCGGTG ATTATGCAAT CCCGGTGACC AACGGTAGTG GTGCTGTCGG TAAGGCGCTG 
GACATTCGTC CACCAGCCCA GCCGCTGGCA CTGGTTTCTG GCGCGCGTAC CCAGTTCACG 
GGCGATACCG CTTCATTGCT GGTGGAAAAT GGTCGTGGCA ATACTCTGTG GCCGCAGGTG 
GTTAGCGTGC TGCAGGCGAA AAACTACACC ATCACCCAAC GTGATGATGC TGGTCAGACA 
CTGACCACCG ATTGGGTACA ATGGAACCGT CTGGACGAAG ACGAGCAGTA TCGTGGTCGT 
TATCAAATCT CTGTTAAGCC GCAGGGTTAT CAGCAGGCGG TTACGGTTAA ACTGCTGAAC 
CTGGAACAGG CGGGCAAACC GGTTGCAGAC GCGGCTTCCA TGCAGCGTTA CAGCACGGAG 
ATGATGAACG TTATTTCCGC CGGTCTGGAT AAATCTGCCA CTGACGCCGC GAACGCTGCG 
CAAAATCGTG CCTCCACCAC TATGGACGTA CAAAGTGCAG CTGATGACAC CGGTTTACCG 
ATGCTGGTCG TACGCGGGCC GTTCAATGTG GTTTGGCAAC GTCTGCCAGC GGCGCTGGAA 
AAAGTGGGCA TGAAAGTGAC CGACAGCACC CGTTCGCAGG GTAACATGGC CGTAACTTAC 
AAGCCGCTGT CTGACAGCGA CTGGCAGGAA CTGGGCGCGA GCGATCCAGG CCTGGCATCC 
GGTGACTATA AACTGCAGGT TGGCGATTTA GATAACCGCA GCAGCCTACA GTTCATCGAT 
CCGAAAGGTC ATACTCTGAC TCAGAGTCAG AATGACGCGC TGGTAGCTGT CTTCCAGGCT 
GCGTTTAGCA AGTAA

Protein sequence

MAYSVQKSRL AKVAGVSLVL LLAACSSDSR YKRQVSGDEA YLEAAPLAEL HAPAGMILPV 
TSGDYAIPVT NGSGAVGKAL DIRPPAQPLA LVSGARTQFT GDTASLLVEN GRGNTLWPQV 
VSVLQAKNYT ITQRDDAGQT LTTDWVQWNR LDEDEQYRGR YQISVKPQGY QQAVTVKLLN 
LEQAGKPVAD AASMQRYSTE MMNVISAGLD KSATDAANAA QNRASTTMDV QSAADDTGLP 
MLVVRGPFNV VWQRLPAALE KVGMKVTDST RSQGNMAVTY KPLSDSDWQE LGASDPGLAS 
GDYKLQVGDL DNRSSLQFID PKGHTLTQSQ NDALVAVFQA AFSK