Gene EcSMS35_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1125
Symbol
ID	6145428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1145153
End bp	1146385
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	51%
IMG OID	641616005
Product	immunoglobulin-binding regulator A-like protein
Protein accession	YP_001743197
Protein GI	170682620
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0856392
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATG ATTTTTCCGC GAAAAAAATC CTGACGGGTG AGGATGTCCT GTGTGCGGCC 
GTTCACCGTA TTGAGTGGTT GTTTGAGACA TTTTCTTCTG TCTGTTTGTC TTTTTCCGGA 
GGAAAAGACT CTACTGTGCT GCTCCATCTT ACGGCCGATG TGGCTCGCAG GAAGAAACGT 
CGTTTCTCTG TATTATTCAT TGACTGGGAA GCTCAGTACC AGTGCACAAT TGCACACATT 
CTGAAGATGA GGGAGATGTA TCGGGATGTG ACGGAGACTT TTTACTGGGT GGCACTCCCC 
CTGACTACGG TAAACGGTGT CTCTCAGTTT CAGCCGGAAT GGATATGCTG GGAACCAGGT 
GTGGAGTGGG TTCGTCAGCC ACCAGATGAC GCTATTACAG ATATGTCGTA CTTCCCATTT 
TATCGGTATG CCATGACGTT TGAAGAATTT GTTCCGGCAT TTTCTTCCTG GTTTGCCGGT 
AACCGGTGTG GAGTGGCAAT ACTGACTGGT GTTCGTGCTG ATGAATCGCT CAATCGCTTT 
GTGGGACTGG TGTCTCAGCG CAAACTGAGA TATGCAGATG ATAAACCCTG GACCACAGCG 
TCACCTGAAG GGTTTTATTA CACCTTGTAT CCGTTGTATG ACTGGAAAGC TCGTGATATA 
TGGATATATA ACGCCAGAAC CCGAGCTATC TACAATCCCC TGTATGACCT GATGTACCGT 
GCCGGCGTGC CGTTACGCAA CATGCGGGTC TGTGAGCCTT TTGGCCCGGA ACAGCGTAAG 
GGACTGTGGC TTTACCATGT TCTGGAGCCG GAAACCTGGG CCAGGATGTG TGAGCGGGTG 
TCGGGTGCTG CCAGCGGGGC GCTTTATGCC AATGAGAGCG GTGCCTATTT TGCCCTGCGT 
AAGCGTATCA CGAAGCCACC TCATCATACC TGGCGTAGCT ATGCGATGTT CCTGCTGGAT 
GTGATGCCGG AAAGAACGGC AGAACATTAC CGTAATAAAA TTGCTGTCTA CCTGCGCTGG 
TATCAGACGC GGGGCTTCCC GGATGACATC CCGGATGAAC AGGAGAATGA CCTGGGGAGC 
CGGGATATCC CGTCCTGGCG ACGTATCTGT AAGACACTCA TAAAGAATGA TTTCTGGTGT 
CGGACCCTCT CCTTCAGTCC GAACAAACCC CGGCACTATG AACGTTATCT GCAGCGTATG 
AAAGAAAGGA GGAAGGAATG GGGGATTCTG TGA

Protein sequence

MNNDFSAKKI LTGEDVLCAA VHRIEWLFET FSSVCLSFSG GKDSTVLLHL TADVARRKKR 
RFSVLFIDWE AQYQCTIAHI LKMREMYRDV TETFYWVALP LTTVNGVSQF QPEWICWEPG 
VEWVRQPPDD AITDMSYFPF YRYAMTFEEF VPAFSSWFAG NRCGVAILTG VRADESLNRF 
VGLVSQRKLR YADDKPWTTA SPEGFYYTLY PLYDWKARDI WIYNARTRAI YNPLYDLMYR 
AGVPLRNMRV CEPFGPEQRK GLWLYHVLEP ETWARMCERV SGAASGALYA NESGAYFALR 
KRITKPPHHT WRSYAMFLLD VMPERTAEHY RNKIAVYLRW YQTRGFPDDI PDEQENDLGS 
RDIPSWRRIC KTLIKNDFWC RTLSFSPNKP RHYERYLQRM KERRKEWGIL