Gene Ndas_2691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2691
Symbol
ID	9246542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3206309
End bp	3207451
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	69%
IMG OID
Product	Microsomal epoxide hydrolase
Protein accession	YP_003680612
Protein GI	297561638
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.116315
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGG ACAACGCACT CACACCGTTT CGCATCGCCA TCCCGCAGGC CGACATCGAC 
GACCTGCGCG ACCGGCTGGC GCACACGCGC TGGCCGGTCC CGGTGCCGGG CCGAGACGAT 
CGCACCGACT TCAGCCGCGG CATCCCGCTG GTGTACCTGA AGGAGCTCGC CGAGTACTGG 
CGCGACGGGT TCGACTGGCG TGCGCAGGAG GAGGGGCTCA ACGAGTACGG ACAGTTCACG 
ACGGCCGTCG ACGGCCAGAC CTTCCACGTC GTCCACGTGC GATCGACGAA CCCGGAGGCC 
GTCCCGCTGA TCCTGAACCA CGGCTGGCCG GGCTCGTTCG TCGAGTACCA GCGGCTCATC 
CCGCTGCTGA CCGATGAGTT CCACGTGGTC GTCCCGTCGC TGCCCGGTTT CGGGTTCTCC 
ACCCCGCTGT CGGGGACCGG CTGGGAGCTG GCGCGGACGA CGGAGGCCTA CGCCGAGATC 
ATGACGCGTC TGGGCTACGA GAGGTTCGCG GCCCACGGCA CCGACATCGG TGCGGGCACC 
ACCGGCCGCC TCGCGGCGCT CCACCCGGAG CGCGTCATCG GCACGCACAT CGGCAGCGAC 
CCGCGGTGGC TCGGGTTGCT CGGCGACAAG TTCCCCTACC CCGACGGTCT GTCCGATGAC 
GAGACCGCCC AGATCGAGGC GGTGCGCGCC GAGGCCGCGG CTGAGCGCGG GTACCTGGCG 
ATGCAGGACC ACCGCCCCGA CACGATCGGC GCGGCGCTCA CCGACTCGCC GGTCGGTCAG 
CTCGCGTGGA TCGCCGAGAA GTTCAAGACC AGGGCCGATG GCGCCTACCG GACGCCGGAC 
GAGACGGTCG ACCGCGACCA GCTCCTCACG AACATCAGCC TGTACTGGTT CACCCGCAGC 
GGCGCGTCGA GCGCGCAGTT CTACTACGAG TCCGCGCACT CCGGAATCGA CTTGGTCACG 
GCCTCCGACG TGCCGTCCGG ATGGGCCGTG TTCGACACCC ACCCGCTCAT GCGCCGCGCG 
GTGGACCCGT GGAAGGCGAT CGGTCACTGG AGCGAGTTCA CCGAGGGCGG TCACTTCCCC 
GCGATGGAGG CGACGGAGCT GCTCGCGGAC GACATCCGTG CCTTCTTCCA CGGCGTTTCC 
TGA

Protein sequence

MNEDNALTPF RIAIPQADID DLRDRLAHTR WPVPVPGRDD RTDFSRGIPL VYLKELAEYW 
RDGFDWRAQE EGLNEYGQFT TAVDGQTFHV VHVRSTNPEA VPLILNHGWP GSFVEYQRLI 
PLLTDEFHVV VPSLPGFGFS TPLSGTGWEL ARTTEAYAEI MTRLGYERFA AHGTDIGAGT 
TGRLAALHPE RVIGTHIGSD PRWLGLLGDK FPYPDGLSDD ETAQIEAVRA EAAAERGYLA 
MQDHRPDTIG AALTDSPVGQ LAWIAEKFKT RADGAYRTPD ETVDRDQLLT NISLYWFTRS 
GASSAQFYYE SAHSGIDLVT ASDVPSGWAV FDTHPLMRRA VDPWKAIGHW SEFTEGGHFP 
AMEATELLAD DIRAFFHGVS