Gene EcSMS35_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2030
Symbol
ID	6143892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2051393
End bp	2052415
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	51%
IMG OID	641616906
Product	hypothetical protein
Protein accession	YP_001744082
Protein GI	170680200
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000821549
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.00000424543
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAG TGTTATTGAT TATCTTGTTA TTGCTGGTGG TACTGGGTAT CGCCGCTGGT 
GTGGGCGTCT GGAAGGTTCG CCATCTTGCC GACAGCAAAT TGCTTATCAA AGAAGAGACG 
ATATTTACCC TGAAGGCTGG GACCGGACGT CTGGCGCTCG GTGAACAGCT TTATGCCGAT 
AAGATCATCA ATCGCCCACG GGTTTTCCAA TGGCTGCTGC GTATCGAACC GGATCTTTCT 
CACTTTAAAG CCGGGACTTA CCGCTTTACA CCGCAGATGA CCGTGCGCGA GATGCTGAAA 
TTGCTGGAAA GCGGTAAAGA AGCACAGTTC CCTCTGCGAC TGGTAGAAGG GATGCGTCTG 
AGCGATTACC TCAAGCAATT GCGTGAGGCC CCGTATATCA AGCATACGCT GAGCGACGAT 
AAGTACGCCA CCGTAGCGCA GGCACTTGAA CTGGAAAACC CAGAGTGGAT TGAAGGTTGG 
TTCTGGCCAG ACACCTGGAT GTATACCGCC AATACCACCG ATGTCGCGTT ACTCAAGCGA 
GCGCACAAGA AAATGGTGAA AGCGGTCGAT AGCGCCTGGG AAGGGCGTGC GGACGGTCTG 
CCCTATAAAG ATAAAAACCA GCTGGTGACG ATGGCATCAA TTATCGAAAA AGAAACCGCC 
GTTGCCAGTG AACGCGATCA GGTTGCCTCG GTATTTATCA ACCGGTTACG CATTGGTATG 
CGCCTGCAGA CCGACCCGAC CGTGATTTAC GGGATGGGAG AGCGTTATAA TGGCAAACTT 
TCTCGTGCAG ACCTGGAAAC GCCGACAGCG TATAACACCT ATACCATTAC CGGTTTGCCG 
CCAGGTGCAA TAGCTACGCC GGGGGCGGAT TCGCTGAAGG CTGCTGCGCA TCCGGCAAAA 
ACGCCGTATC TCTATTTTGT GGCCGATGGT AAAGGTGGTC ACACGTTTAA TACCAATCTT 
GCCAGTCATA ACAAGTCTGT GCAGGATTAT CTGAAAGTGC TTAAGGAAAA AAATGCGCAG 
TAA

Protein sequence

MKKVLLIILL LLVVLGIAAG VGVWKVRHLA DSKLLIKEET IFTLKAGTGR LALGEQLYAD 
KIINRPRVFQ WLLRIEPDLS HFKAGTYRFT PQMTVREMLK LLESGKEAQF PLRLVEGMRL 
SDYLKQLREA PYIKHTLSDD KYATVAQALE LENPEWIEGW FWPDTWMYTA NTTDVALLKR 
AHKKMVKAVD SAWEGRADGL PYKDKNQLVT MASIIEKETA VASERDQVAS VFINRLRIGM 
RLQTDPTVIY GMGERYNGKL SRADLETPTA YNTYTITGLP PGAIATPGAD SLKAAAHPAK 
TPYLYFVADG KGGHTFNTNL ASHNKSVQDY LKVLKEKNAQ