Gene EcSMS35_3635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3635
Symbol
ID	6143985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3695332
End bp	3696354
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	54%
IMG OID	641618462
Product	putative hydrolase
Protein accession	YP_001745602
Protein GI	170683037
COG category	[R] General function prediction only
COG ID	[COG0429] Predicted hydrolase of the alpha/beta-hydrolase fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.617226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0000831591
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGCAGA TAACGACGAC CGATGCCAAT GAATTCAGCA GCAGTGCTGA ATTCACCCCT 
ATGCGCGGCT TTAGCAATTG TCATCTGCAA ACCATGCTGC CGCGTCTGTT TCGTCGCAAG 
GTGAAATTCA CCCCGTACTG GCAGCGGCTG GAGTTGCCCG ACGGCGATTT TGTCGATCTC 
GCATGGAGTG AAGACCCTGC CCAGGCGAAC CATAAACCGC GTTTAGTGGT GTTTCACGGG 
CTGGAGGGCA GCCTCAATAG CCCTTACGCC CACGGTCTGG TCGAGGCGGC GCAAAAACGC 
GGCTGGCTGG GCGTGGTGAT GCATTTTCGC GGATGCAGCG GTGAACCAAA CCGTATGCAC 
CGCATTTACC ATTCGGGCGA AACCGAAGAC GCCAGCTGGT TTTTACGCTG GCTGCAGCGC 
GAATTTGGAC ATGCGCCAAC GGCTGCCGTC GGCTATTCGC TCGGCGGTAA TATGCTCGCC 
TGTTTGCTGG CAAAAGAAGG TAATAACCTC CCGATTGATG CAGCGGTAAT TGTCTCCGCG 
CCATTTATGC TGGAAGCCTG TAGTTATCAT ATGGAAAAGG GCTTTTCCCG CGTTTATCAG 
CGTTACTTGC TGAACCTGTT AAAAGCCAAT GCTGCGCGCA AACTGGCAGC CTATCCCGGT 
ACGCTGCCGA TTAATCTCGC ACAGTTAAAA TCGGTACGTC GCATCCGTGA ATTTGACGAT 
CTGATCACCG CCAGAATTCA CGGCTACGCT GACGCTATCG ACTATTATCG TCAGTGTAGC 
GCCATGCCGA TGCTGAACCA GATCGCCAAA CCGACGCTGA TTATTCACGC CAAAGACGAT 
CCGTTTATGG ATCATCAGGT GATCCCGAAA CCGGAAAGTC TCCCCCCGCA GGTGGAGTAT 
CAACTGACTG AACATGGCGG TCATGTTGGC TTTATTGGCG GTACGTTACT TCATCCGCAA 
ATGTGGCTGG AGTCACGCAT TCCTGACTGG TTAACAACGT ATCTGGAGGC GAAATCATGT 
TGA

Protein sequence

MAQITTTDAN EFSSSAEFTP MRGFSNCHLQ TMLPRLFRRK VKFTPYWQRL ELPDGDFVDL 
AWSEDPAQAN HKPRLVVFHG LEGSLNSPYA HGLVEAAQKR GWLGVVMHFR GCSGEPNRMH 
RIYHSGETED ASWFLRWLQR EFGHAPTAAV GYSLGGNMLA CLLAKEGNNL PIDAAVIVSA 
PFMLEACSYH MEKGFSRVYQ RYLLNLLKAN AARKLAAYPG TLPINLAQLK SVRRIREFDD 
LITARIHGYA DAIDYYRQCS AMPMLNQIAK PTLIIHAKDD PFMDHQVIPK PESLPPQVEY 
QLTEHGGHVG FIGGTLLHPQ MWLESRIPDW LTTYLEAKSC