Gene Sare_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4043
Symbol
ID	5706306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4600969
End bp	4602225
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	641273469
Product	erythromycin esterase
Protein accession	YP_001538824
Protein GI	159039571
COG category	[R] General function prediction only
COG ID	[COG2312] Erythromycin esterase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.171008
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGTTC AGCGGCTCGG CGCCCCGAGC GACTTCGACC CGCTACTGGA GCGCGCCCGG 
GACGCCCGGA TCGTCATGCT CGGGGAGGCG ACCCACGGTA GCCACGACTA CTACCGGCTG 
CGTGGGCAGC TCACCCAGCG CCTGATCGTC GAAGAGGGCT TCTCGTTCGT CGCGGTGGAG 
GGGGACTGGC CGGACTGTGA CCGGGTGCAC CGCTCGGTCA CGGCAGCCCC CGGCGCAGCC 
GTCGAACCAC AGGCCGCCCT CGAACGGTTC GAACGGTGGC CCACCTGGAT GTGGGCGAAT 
GCGGAGGTAG CGCGCTTCTG TCGCTGGCTG CGGGCGTTCA ATGGGGAGCG GCCCGAGCCG 
GAGCGGGTCG GCTTCCACGG GTTGGACGTC TACAGCCTGT GGGAGTCGAT GCAGGCCATC 
TTCGACTATC TGGGAGAGGA GGCTCCGGGT TCACTGGACG CCGCGCAGAA CGCCTACCAG 
TGCTTCGAGC CGTACGGCCG GCGGGTCGAG GAGTACGGTG CGGCAGGCCG ATTCGTCTCC 
GCGCGCTGTG AGGACGAGGT GGTGTGGTTG CTGGCGCGGA TTCGAGAACA CGCGGCGGCG 
GACGGTGCGG ACGCCTTCTC GGCCTGGCAG AACGCGGAAG TCGTCGCCGG CGCCGAGCGG 
TACTACCGGG CGATGGTCGC GGGTGGACCG GAGTCGTGGA ACGTCCGGGA TCACCACATG 
GCCGACACGC TGGACCGATT GCTGGAGCGC TACGGCCCGG GGGCGCGCGG GGTGGTGTGG 
GCACACAACA CCCACATCGG TGACGCGCGG GCGACCGACA TGGCCGCCGA CGGCATGGTG 
AACCTCGGCC AACTGGCCCG GGATCGGCAC GGCCGGGAGG ACGTCGTCCT GGTCGGGTTC 
GGCAGCCATC GGGGTACGGT GGTCGCCGCG CCGCGCTGGG GCTCACCGGC CGAGACGATG 
ATCGTGCCCC CGGCCCGGGA GGGGTCGGTG GAGCGGCGGC TGCACGAACT GCTGCCGGAG 
CGGGCTGTGC TGGTATTCGG CGGTGCCGAC CAGCCGGGCT GGGTTACCGA GCCGCTGGAC 
CACCGGGCGA TCGGGGTGGT GTACGACCCC TCGTTCGAGT CCTTGGGTAA CTACCAGCCG 
ACGCGGCTGG GGGAGCGGTA CGACGGGTTC GTCTGGTGCG ACGAGGCGAC AGCCCTGCAC 
CCACTTGCGG CTCGCGGCAC CCGCGGTGAG TTGGAGACGT ACCCGGCGGG CGTGTAG

Protein sequence

MLVQRLGAPS DFDPLLERAR DARIVMLGEA THGSHDYYRL RGQLTQRLIV EEGFSFVAVE 
GDWPDCDRVH RSVTAAPGAA VEPQAALERF ERWPTWMWAN AEVARFCRWL RAFNGERPEP 
ERVGFHGLDV YSLWESMQAI FDYLGEEAPG SLDAAQNAYQ CFEPYGRRVE EYGAAGRFVS 
ARCEDEVVWL LARIREHAAA DGADAFSAWQ NAEVVAGAER YYRAMVAGGP ESWNVRDHHM 
ADTLDRLLER YGPGARGVVW AHNTHIGDAR ATDMAADGMV NLGQLARDRH GREDVVLVGF 
GSHRGTVVAA PRWGSPAETM IVPPAREGSV ERRLHELLPE RAVLVFGGAD QPGWVTEPLD 
HRAIGVVYDP SFESLGNYQP TRLGERYDGF VWCDEATALH PLAARGTRGE LETYPAGV