Gene Arth_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2047
Symbol
ID	4445421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2308302
End bp	2309633
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	66%
IMG OID	639689855
Product	erythromycin esterase
Protein accession	YP_831527
Protein GI	116670594
COG category	[R] General function prediction only
COG ID	[COG2312] Erythromycin esterase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAACG GAAACCGTGC TGTCCTGAGC ATGCTGGACG AGATCCGCAC CCTGGCCCGG 
CCCCTCACCG GGATCCGGGA CCTTGACCGG CTGGTCCACG GCGCCGGTAC CGGACGCTTC 
GTGGCCATCG GCGAAGCATC CCACGGCACG CACGAGTACT ACACCATGCG TGCCCGCCTG 
AGCATGCGGC TGATCGAAGA GCAGGGTTAC AGCTGGATCG GGGTGGAAGG CGACTGGCCG 
GACTGCTGGC GGATCAACCG CTGGGTCCGG GGACAAAGCG GCCAGGACAC TGGAGTGCAC 
ACCATGCTCG CCGGATTCGG GCGCTGGCCC ACCTGGATGT GGGCAAACGA GGAAGTGGCA 
GGCTTCCTTG ACTGGCTCCG CGGCTGGAAC CTGGAGCGTC CGATGGAAGA GCGGGTTGGC 
TTCTACGGGC TGGACGTCTA CTCACTGTGG GATTCCCTGC GGGAGATCAT CGGCTGGCTC 
GAGGAAAACG AGCCCGACGC CGTCCCCGCT GCCATGCGGG CGTGGCGGTG TTTCCTTCCG 
CATCACGAAG ACCCGCACGA GTACGCCTGG AGCACCCGGC TGGTCCCCGA ATCGTGCGAG 
GCTGATGTGG TTGCACTCCT CACCGAGGTG CGGAACCGGG CATTTGCGCT GCGCGACCAC 
GAACCGCGCG TCGAAAGCGA TGAGGCTTTC GACGCGGTCC AGAACGCTGT GGTTGCCGCC 
AACGCCGAGC ATTACTACCG CATCATGGTG CAGGGGAGCC GCGAGTCCTG GAACGTCCGG 
GACCTTCACA TGGCGGACAC CGTGGACCGG TTGAGTGCGC ATCTGGGCCC GGCGTCCAAA 
GGGATCATCT GGGAGCACAA CACCCATGTG GGCGATGCGC GGGCCACGGA CATGGCGCGG 
GACGGGCTGG TGAACGTTGG CCAGCTGCTC CGCGAGCGCC ACGGTTCCGA AGGCGTCACC 
CTGGTGGGTT TCGGATCGTA CCGGGGAACA GTCATGGCTG CGGACGCCTG GGGCTCCCCG 
GAACGGGTGC TCACGGTGCC GGAAGCCCGG ACCGGCAGCC ACGAGGATCT GCTGCACCGG 
GCCCTGGGCG CACCGGCATT GTTGGAATTC GGCGGGGACA GGTCCGGGCC GTGGCTGTCA 
ACCTGGTTGG GTCACCGGGC CATCGGTGTT GTCTACCGCC CGGCCAGGGA ATCCGGAAAC 
TACGTTCCCA CCCGGATGGG AGGGCGTTAC GACGCCCTCA TCTGGATGGA ACAGACCTCG 
GCGCTTCGTC CGCTGCATCA CGAGGCTCCG CCGAGTGAGC CGGAGTTCGA AACGGAGCCC 
ACCGGATTCT GA

Protein sequence

MTNGNRAVLS MLDEIRTLAR PLTGIRDLDR LVHGAGTGRF VAIGEASHGT HEYYTMRARL 
SMRLIEEQGY SWIGVEGDWP DCWRINRWVR GQSGQDTGVH TMLAGFGRWP TWMWANEEVA 
GFLDWLRGWN LERPMEERVG FYGLDVYSLW DSLREIIGWL EENEPDAVPA AMRAWRCFLP 
HHEDPHEYAW STRLVPESCE ADVVALLTEV RNRAFALRDH EPRVESDEAF DAVQNAVVAA 
NAEHYYRIMV QGSRESWNVR DLHMADTVDR LSAHLGPASK GIIWEHNTHV GDARATDMAR 
DGLVNVGQLL RERHGSEGVT LVGFGSYRGT VMAADAWGSP ERVLTVPEAR TGSHEDLLHR 
ALGAPALLEF GGDRSGPWLS TWLGHRAIGV VYRPARESGN YVPTRMGGRY DALIWMEQTS 
ALRPLHHEAP PSEPEFETEP TGF