Gene Ndas_1949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1949
Symbol
ID	9245799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2372813
End bp	2374066
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	75%
IMG OID
Product	Erythromycin esterase
Protein accession	YP_003679882
Protein GI	297560908
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.372413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00455868
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACACTG GCACCACGAT CACCGCACAC ACCTTCGAGG CCGCCGCCGC CATGGGGCTG 
CTCCCGGCCC GGCCGCGACT GCTCGCCCTG GGCGAGCCCA CCCACGGGGA GGACGCCCTG 
CTGGACCTGC GCAACGGGCT CTTCCGCCAG CTCGTCGAGC AGGAGGGCTA CCGGACGATC 
GCCGTCGAGA GCGACTGTCT GGCGGGCCTG GCCGTGGACG CGTACGTCAC CTCGGGCACG 
GGCACCCTCG ACGAGGCCAT GGAGCACGGG TTCAGCCACG GGCTCGGCGC GTCGGCGGCC 
AACCGCGAAC TCGTACGCTG GATGCGCGCC CACAACGACG GCAGGCCCGC CGCCGAACAG 
GTGCGCTTCG CCGGTTTCGA CGGCCCGCTG GAGGTCACCG GCGCCCAGAG CCCCCGGCGG 
GCCCTGACCG CGCTCCACGA CTACCTCGCG CGCTGGGTGG AGGCGGACCA GCTCCCGTGC 
GACGCGCGGA CGCTGGACCG CCTGGTCGGC GACGACGCGC GGTGGACCAA CCCCGACGCG 
ATGCTGGACC CGGCCGAGTC CGTGGGGCGC TCGGACGACG TCCGGGAGCT GCGCATGCTC 
GCCGACGACC TGGCGGCGCT GCTCGACGCG CACACGCCGC GCCTGGTCTC GGCGACCTCG 
CGCGAGGACT GGGACCGGGC GCGCCTGTAC GGGCGCACCG CCACCGGCCT GCTGCGCTAC 
CACTTCTGGA TGGCCGACAC CTCCTCGCGC CGCATGACGC GGCTGGAGGA CCTGGGCATG 
ACGGTCGACA CCTCACCGAG CCGGATGACG CGGCTGCTGG GCCTGCGCGA CCAGATGATG 
GCCGACAACC TCTTCGCCCT CGCCGAGCGG GGCCCGGTGC TGGTCCACGC CCACAACTCC 
CACCTCCAGC GCGGCATGAG CACGATGCGG ATGGGCGGGC CGCCGCTGGA CTGGTGGGGC 
GCCGGGGCGA TCGCGGGCGC CCGCCTGGGG CAGGAGTACG CCTTCCTGGC CACGGCCGTG 
GGCACGATCC GGCACCGGGG CGTGGACACC CCGCCCCCGG ACAGCGTCGA GGGCCTCCTG 
TACGCCCTCG GGGAGGAGCG CTGCGTGGTC GACGCGCCCC GGCTGGCCGC GGACCTGGAC 
GGCGCGATCC CCGCACCCCG TGTGTCCCCC TGGTTCGGCT ACGCCCCGCT CGATCCGGCC 
CGTCTGGCCG ACAGCGACGG GATCGTGTTC GTCAGGGACC TCCGGCAGGG CTGA

Protein sequence

MDTGTTITAH TFEAAAAMGL LPARPRLLAL GEPTHGEDAL LDLRNGLFRQ LVEQEGYRTI 
AVESDCLAGL AVDAYVTSGT GTLDEAMEHG FSHGLGASAA NRELVRWMRA HNDGRPAAEQ 
VRFAGFDGPL EVTGAQSPRR ALTALHDYLA RWVEADQLPC DARTLDRLVG DDARWTNPDA 
MLDPAESVGR SDDVRELRML ADDLAALLDA HTPRLVSATS REDWDRARLY GRTATGLLRY 
HFWMADTSSR RMTRLEDLGM TVDTSPSRMT RLLGLRDQMM ADNLFALAER GPVLVHAHNS 
HLQRGMSTMR MGGPPLDWWG AGAIAGARLG QEYAFLATAV GTIRHRGVDT PPPDSVEGLL 
YALGEERCVV DAPRLAADLD GAIPAPRVSP WFGYAPLDPA RLADSDGIVF VRDLRQG