Gene EcSMS35_3187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3187
Symbol
ID	6146755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3270859
End bp	3271968
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	49%
IMG OID	641618024
Product	putative immunoglobuling-binding protein
Protein accession	YP_001745174
Protein GI	170681895
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.725317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAAA GACGTGATGC TTTTTTAAAG AAAAGCGCGC TGGCAGTGAG TGTGGCCCTG 
CTGCTCTCAT CTCAGGCTTC GGCTAATAAA TCAATTACTG ATTCAACGGC GGGTATTATC 
TGGATTGATG GTGGCGGTCA GTCACTTGAA AAAGTAGCTG TGATTGACCG TCAACTAAAT 
GATACAGGAT ATAATTTTGC CGTAGGTAGT GGTGCAGCAA TTCTGGATGC GGATAAATCC 
ATGGCAGTGG GAAATAATAC AGCTGTTTTT AATGCAGACA ACAGTGTCGC TCTGGGGTAT 
GGCTCTCAGG TGAATGGAGA AAGCAATGTA CTTTCTGTAG GGGCCGGTCC TTCAGGATAT 
GGATTTTCAG TTGATGGTGC ACCGGAAACC CGCCGGATTA TAAATGTTTC AGATGGTGTT 
AAGGATAGTG ATGCGGCCAC AAAAGGACAG ATGGACAACG CCATTGCAGA TGCTGTACGG 
GAGTCGGGGG ATGCCCTGCG CGGTGAGATA GGAGCTGTCT ACCGTGATGC TGTTGCTGAT 
GCTAAGAGTC GAGTGGAATC GGCAGAAAAC AGACTTAACG GTAATATTAC AGCTGCCAGG 
GCTTCTGCGC AGGAATACAC GGATGCGGTG AAGTCGGATG TTCTGGACGA GACGCGTACA 
TATACAGACA GCAGTGTGCG TACTGTCCGT AACGAGGTGA AAAGCCAGGC AGAACATCTC 
AGCGATGTGC TTGTGAAGAA CAGGGCGCAG ACGGATGCAG CAATAGCCTC AAATACAGCA 
GCGATAAGGA ATAACAGTCA TCGTCTGGAT TTGACGGAAG CCTGGCAGAA GATGGCGACA 
GAGAGAATGA ATAATATGCA GGAGCAGATT AAAGAGAACC GGAAGGAGTT AAGGGAGAGT 
GCAGCCCAGA GCGCGGCACT GGCAGGTCTT TTCCAGCCAT ACAGTGTTGG AAAATTTAAC 
GCGACAGCAG CCGTTGGTGG TTACCGTGAT GAGCAGGCCA TTGCGGTGGG CGTGGGCTAC 
CGTTTCACAG AGAATGTGGC AGGAAAAGTT GCAGTTGCTG CAGGTGGGTC ATCCGCATCG 
TGGAATGCTG GTGTGAATTT TGAGTTCTGA

Protein sequence

MLKRRDAFLK KSALAVSVAL LLSSQASANK SITDSTAGII WIDGGGQSLE KVAVIDRQLN 
DTGYNFAVGS GAAILDADKS MAVGNNTAVF NADNSVALGY GSQVNGESNV LSVGAGPSGY 
GFSVDGAPET RRIINVSDGV KDSDAATKGQ MDNAIADAVR ESGDALRGEI GAVYRDAVAD 
AKSRVESAEN RLNGNITAAR ASAQEYTDAV KSDVLDETRT YTDSSVRTVR NEVKSQAEHL 
SDVLVKNRAQ TDAAIASNTA AIRNNSHRLD LTEAWQKMAT ERMNNMQEQI KENRKELRES 
AAQSAALAGL FQPYSVGKFN ATAAVGGYRD EQAIAVGVGY RFTENVAGKV AVAAGGSSAS 
WNAGVNFEF