Gene EcSMS35_3828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3828
Symbol
ID	6145094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3896905
End bp	3898965
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	54%
IMG OID	641618654
Product	AsmA family protein
Protein accession	YP_001745794
Protein GI	170680242
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2982] Uncharacterized protein involved in outer membrane biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0975888
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG CAGGCAAAAT AACCGCTGCG ATTTCAGGGG CTTTCTTGTT GTTGATTGTC 
GTGGCGATCA TTTTGATTGC AACTTTTGAC TGGAATCGAC TCAAACCGAC CATCAACCAG 
AAAGTCTCTG CGGAGTTGAA TCGTCCGTTC GCTATCCGTG GCGATCTGGG CGTGGTGTGG 
GAGCGGCAAA AACAAGAAAC TGGCTGGCGC AGCTGGGTAC CGTGGCCCCA TGTACACGCG 
GAAGACATCA TTCTTGGCAA TCCACCGGAT ATTCCCGAAG TCACAATGGT GCATTTGCCG 
CGAGTAGAAG CGACGCTGGC CCCGCTGGAG CTGCTGACCA AAACGGTCTG GTTGCCGTGG 
ATCAAGCTCG AAAAGCCCGA CGCGCGCCTG ATTCGCCTCT CCGAAAAGAA CAATAACTGG 
ACGTTTAATC TCGGCAACGA TGACAACAAA GACGCGAATG CAAAGCCGTC GGCGTGGTCG 
TTTCGGCTGG ATAATATTCT GTTCGATCAA GGGCGGATCG CCATTGATGA CAAAGTAAGC 
AAAGCGGATC TGGAAATTTT TGTCGATCCG TTAGGCAAGC CGCTGCCGTT CAGCGAAGTT 
ACCGGATCGA AAGGTAAAGC GGATAAAGAA AAGGTGGGCG ATTACGTTTT TGGCCTGAAG 
GCGCAGGGAC GTTATAACGG TGAACCGCTC ACTGGTACGG GAAAAATAGG CGGTATGCTG 
GCGCTGCGTG GCGAAGGTAC GCCGTTTCCG GTACAGGCTG ATTTCCGCTC TGGTAACACC 
CGTGTTGCTT TTGATGGCGT TGTGAATGAC CCAATGAAGA TGGGGGGTGT CGATTTACGG 
CTTAAATTTT CTGGCGATTC GCTGGGTGAT CTCTATGAAC TGACGGGCGT TCTGCTGCCC 
GATACCCCGC CGTTTGAAAC GGATGGTCGG CTGGTAGCGA AAATCGACAC TGAAAAATCG 
TCGGTCTTTG ATTATCGCGG TTTTAATGGG CGCATTGGCG ATAGCGATAT CCACGGTTCT 
CTGATCTACA CCACCGGCAA GCCACGACCA AAACTGGAAG GTGATGTCGA GTCGCGGCAA 
TTGCGGCTGG CGGACCTGGG ACCGTTGATT GGCGTTGATT CCGGGAAAGG AGCTGAAAAG 
TCGACACGGT CTGAACAGAA GAAGGGTGAA AAAAGCGTTC AGCCTGCGGG CAAAGTGCTG 
CCTTATGACC GCTTCGAAAC CGATAAATGG GATGTCATGG ATGCCGATGT TCGCTTCAAA 
GGGCGGCGCA TTGAACATGG CAGTAGCCTG CCGATTAGCG ATCTTTCTAC TCATATCATC 
CTCAAAAATG CTGACCTGCG CCTGCAACCG CTGAAATTTG GCATGGCGGG CGGCAGCATT 
GCGGCGAATA TTCATCTGGA AGGCGATAAA AAGCCGATGC AGGGGCGGGC AGATATTCAG 
GCTCGTCGAC TGAAACTGAA AGAACTGATG CCCGATGTAG AACTGATGCA GAAGACGCTG 
GGGGAAATGA ACGGTGACGC GGAACTACGC GGTAGCGGTA ACTCGGTGGC GGCGCTTTTA 
GGCAACAGTA ACGGCAACCT GAAACTGTTG ATGAATGACG GGCTGGTGAG CCGCAACCTG 
ATGGAGATTG TCGGGCTGAA TGTCGGCAAC TACATTGTCG GTGCGATATT TGGTGACGAT 
GAGGTGCGGG TGAACTGCGC GGCGGCGAAT CTTGATATTG CCAACGGCGT GGCGCGCCCG 
CAGATCTTTG CTTTCGATAC GGAGAACGCG TTGATTAACG TTACCGGCAC GGCAAGTTTT 
GCTTCGGAAC AGCTGGATTT GACTATCGAT CCAGAAAGTA AAGGGATTCG GATTATCACA 
CTGCGTTCGC CGCTGTATGT GCGTGGGACG TTTAAAAATC CGCAGGCTGG GGTAAAAGCC 
GGACCGTTGA TTGCTCGCGG AGCCGTCGCG GCGGCACTGG CAACGCTGGT TACGCCAGCG 
GCGGCGTTAC TGGCGCTGAT CTCTCCTTCC GAAGGGGAGG CTAATCAGTG TCGGACGATT 
TTGTCGCAGA TGAAGAAGTG A

Protein sequence

MSKAGKITAA ISGAFLLLIV VAIILIATFD WNRLKPTINQ KVSAELNRPF AIRGDLGVVW 
ERQKQETGWR SWVPWPHVHA EDIILGNPPD IPEVTMVHLP RVEATLAPLE LLTKTVWLPW 
IKLEKPDARL IRLSEKNNNW TFNLGNDDNK DANAKPSAWS FRLDNILFDQ GRIAIDDKVS 
KADLEIFVDP LGKPLPFSEV TGSKGKADKE KVGDYVFGLK AQGRYNGEPL TGTGKIGGML 
ALRGEGTPFP VQADFRSGNT RVAFDGVVND PMKMGGVDLR LKFSGDSLGD LYELTGVLLP 
DTPPFETDGR LVAKIDTEKS SVFDYRGFNG RIGDSDIHGS LIYTTGKPRP KLEGDVESRQ 
LRLADLGPLI GVDSGKGAEK STRSEQKKGE KSVQPAGKVL PYDRFETDKW DVMDADVRFK 
GRRIEHGSSL PISDLSTHII LKNADLRLQP LKFGMAGGSI AANIHLEGDK KPMQGRADIQ 
ARRLKLKELM PDVELMQKTL GEMNGDAELR GSGNSVAALL GNSNGNLKLL MNDGLVSRNL 
MEIVGLNVGN YIVGAIFGDD EVRVNCAAAN LDIANGVARP QIFAFDTENA LINVTGTASF 
ASEQLDLTID PESKGIRIIT LRSPLYVRGT FKNPQAGVKA GPLIARGAVA AALATLVTPA 
AALLALISPS EGEANQCRTI LSQMKK