Gene Strop_3666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3666
Symbol
ID	5060142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4205407
End bp	4206663
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	640475922
Product	erythromycin esterase
Protein accession	YP_001160475
Protein GI	145596178
COG category	[R] General function prediction only
COG ID	[COG2312] Erythromycin esterase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.895464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGTTC AGCGGCTCGG CGCCCCGAGT GACTTCGACC CGTTGCTGGA GCGCGCCCGG 
GACGCCCGGA TCGTGATGCT CGGGGAGGCG ACCCACGGCA GCCATGACTA CTACCGGCTG 
CGCGGGGAGC TGACCCGGCG GTTGATCGCC GAGGGGGGCT TCTCGTTCGT CGCGGTCGAG 
GGGGACTGGC CGGACTGCGA CCGGGTGCAT CGCTCGGTCA CGGCCGACCC CGACGCCGCG 
GTCGAACCGC GGGCCGCCCT CGAGCGGTTC GAGCGGTGGC CCACCTGGAT GTGGGCGAAC 
GCGGAGGTGG CCCGCTTCTG CCGCTGGCTA CGGGAGTGGA ACGGGCAACG GCCCGAACCG 
GAACGGGTGG GCTTCCACGG GTTGGACGTC TACAGCCTCT GGGAGTCGAT GCAGGCCATC 
TTCGACTACC TGGGGGAGGA GGCACCGGGG ACACTGGACG CGGCGCAGGA CGCCTACCGG 
TGCTTCGAGC CGTACGGACG GCGAATCGAG GAGTACGGTG CGGCGAGCCG GTTCGTCTCC 
GCACGGTGTG AGGACGAGGT TGTCTGCCTG CTCGCGCGGA TTCGGGAACA CGCGGCGAGC 
GACGGTGCGG ACGCCTTCTC GGCCTGGCAG AACGCGGAGG TCGTCACCGG CGCGGAGCGG 
TACTACCGCG CCATGGTCGG GGGTGGACCA GAGTCGTGGA ACGTCCGGGA CCACCACATG 
GCCGACACGC TCGACCGGTT GCTGGATCGC TACGGCCCCG GGGCGCGTGG GGTGGTGTGG 
GCCCACAACA CCCACATCGG GGACGCGCGG GCAACCGACA TGGCCGCCGA CGGCATGGTG 
AACCTCGGCC AGCTGGCCCG GGACCGGTAC GGCCGGGACG ATGTGGTCCT GGTCGGCTTC 
GGTAGCCATC GGGGCACGGT GGTCGCCGCG CCGCACTGGG GCTCGCCGGC CGAGAAGATG 
ATCGTTCCAC CGGCCCGGGA GGGCTCGGTG GAGCGGCGCC TGCACGACCT GCTGCCCGAG 
CAGGCGGTGC TGGTCTTCGG CGGTGCCGAC CAGCCGGACT GGGTCACCGA GCCGTTGGAC 
CACCGGGCGA TCGGTGTGGT CTACAACCCC TCCTCCGAGT CCTGGGGTAA CTATCAGCCG 
ACGCGGCTGG GGGAGCGATA CGACGGGTTC GTCTGGTGTG ACGAGGCGAC CGCCCTGGAC 
CCGCTCCCCG CTCGGGGTGC CCGCGGTGAG CTGGAGACGT ACCCGGCCGG GGTGTAG

Protein sequence

MLVQRLGAPS DFDPLLERAR DARIVMLGEA THGSHDYYRL RGELTRRLIA EGGFSFVAVE 
GDWPDCDRVH RSVTADPDAA VEPRAALERF ERWPTWMWAN AEVARFCRWL REWNGQRPEP 
ERVGFHGLDV YSLWESMQAI FDYLGEEAPG TLDAAQDAYR CFEPYGRRIE EYGAASRFVS 
ARCEDEVVCL LARIREHAAS DGADAFSAWQ NAEVVTGAER YYRAMVGGGP ESWNVRDHHM 
ADTLDRLLDR YGPGARGVVW AHNTHIGDAR ATDMAADGMV NLGQLARDRY GRDDVVLVGF 
GSHRGTVVAA PHWGSPAEKM IVPPAREGSV ERRLHDLLPE QAVLVFGGAD QPDWVTEPLD 
HRAIGVVYNP SSESWGNYQP TRLGERYDGF VWCDEATALD PLPARGARGE LETYPAGV