Gene EcSMS35_4824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4824
Symbol
ID	6144928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4911105
End bp	4912757
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	38%
IMG OID	641619628
Product	hypothetical protein
Protein accession	YP_001746735
Protein GI	170681444
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGCGC AGCTTTTTGA GCAGTTGTTT CAATCGATAG ACTCTACACT GATCACCAAT 
ATTTTCATCT GGGCTGTTAT ATTCGTATTT TTATCAGCGT GGTGGTGTGA CAAAAAAAAT 
ATACATAGTA AGTTTAGAGA ATATGCTCCA ACCTTAATGG GGGCATTAGG TATTCTGGGT 
ACTTTCATTG GTATTATTAT TGGGTTACTC AATTTTAATA CTGAAAGTAT TGATACCAGC 
ATCCCCGTAT TATTAGGCGG CCTAAAAACA GCATTCATTA CAAGCATTGT AGGTATGTTT 
TTTGCCATTT TATTTAATGG AATGGATGCT TTCTTTTTTG CCAATAAACG AAGTGCGTTA 
GCAGAAAATA ACCCTGAATC TGTTACACCT GAACATATCT ATCATGAATT AAAAGAGCAG 
AACCAGACTC TGACTAAATT AGTCTCGGGT ATTAACGGTG ATAGTGAAGG TTCTCTTATT 
GCTCAAATAA AATTACTACG TACTGAGATT AGCGATTCCT CGCAGGCACA ATTAGCTAAT 
CACACTCATT TCAGTAATAA GCTTTGGGAA CAACTTGAAC AATTTGCAGA TCTAATGGCA 
AAAGGTGCTA CAGAACAAAT TATTGATGCT TTACGACAAG TCATTATTGA TTTTAATGAA 
AATTTAACTG AACAGTTTGG TGAAAACTTT AAAGCACTTG ATGCCTCTGT AAAAAAACTT 
GTTGAGTGGC AGGAAAATTA TAAAACGCAA GTTGAGCTGA TGTCAGAACA ATATCAACAA 
AGTGTCGAGT CTCTGGTTGA AACAAAAACT GCGGTTGCCG GGATTTGGGA AGAATGTAAA 
GAAATTCCTC TGGCTATGTC TGAACTGCGT GAAGTGCTTC AGGTGAACCA ACATCAAATC 
AGCGAACTCT CCCGCCATTT AGAAACCTTT GTCGCCATCC GCGATAAAGC TACAACCGTA 
TTACCTGAAA TACAGAACAA AATGGCTGAA GTGGGTGAAC TGCTGAAATC CGGAGCTGCA 
AATGTTAGTG CATCTCTTGA GCAAACCAGC CAGCAAATAC TTCTTAATGC AGATTCAATG 
CGCGTGGCCC TGGATGAAGG TACCGAAGGA TTCAGACAAT CGGTTACCCA AACACAACAA 
GCATTTGCCT CGATGGCACA TGATGTCAGC AATTCCTCCG AAACTCTAAC CAGCACGTTA 
GGTGAAACAA TTACTGAAAT GAAACAAAGT GGTGAAGAAT TCCTGAAGTC ACTAGAGTCG 
CACTCGAAAG AATTGCATAG AAATATGGAA CAAAATACGA CTAATGTAAT TGATATGTTC 
AGTAAGACTG GTGAAAAGAT TAACCATCAA CTATCCAGTA ATGCCGATAA TATGTTTGAT 
TCAATCCAGA CATCATTTGA TAAGGCAAGT GCAGGGCTGA CTTCTCAAGT CAGAGAATCA 
ATTGAAAAAT TTGCTCTATC CATCAACGAG CAGTTACATG CTTTTGAGCA AGCAACTGAA 
CGTGAGATGA ACCGTGAAAT GCAATCATTA GGTAATGCTC TGCTTTCAAT CAGCAAAGGT 
TTTGTCGGTA ACTATGAAAA ACTTATTAAA GATTACCAAA TAATTATGGG GCAGTTACAA 
GCATTAATTT CTGCTAATAA ACATCGAGGG TAA

Protein sequence

MLAQLFEQLF QSIDSTLITN IFIWAVIFVF LSAWWCDKKN IHSKFREYAP TLMGALGILG 
TFIGIIIGLL NFNTESIDTS IPVLLGGLKT AFITSIVGMF FAILFNGMDA FFFANKRSAL 
AENNPESVTP EHIYHELKEQ NQTLTKLVSG INGDSEGSLI AQIKLLRTEI SDSSQAQLAN 
HTHFSNKLWE QLEQFADLMA KGATEQIIDA LRQVIIDFNE NLTEQFGENF KALDASVKKL 
VEWQENYKTQ VELMSEQYQQ SVESLVETKT AVAGIWEECK EIPLAMSELR EVLQVNQHQI 
SELSRHLETF VAIRDKATTV LPEIQNKMAE VGELLKSGAA NVSASLEQTS QQILLNADSM 
RVALDEGTEG FRQSVTQTQQ AFASMAHDVS NSSETLTSTL GETITEMKQS GEEFLKSLES 
HSKELHRNME QNTTNVIDMF SKTGEKINHQ LSSNADNMFD SIQTSFDKAS AGLTSQVRES 
IEKFALSINE QLHAFEQATE REMNREMQSL GNALLSISKG FVGNYEKLIK DYQIIMGQLQ 
ALISANKHRG