Gene Ndas_1361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1361
Symbol
ID	9245211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1668427
End bp	1670451
Gene Length	2025 bp
Protein Length	674 aa
Translation table	11
GC content	71%
IMG OID
Product	hydrolase CocE/NonD family protein
Protein accession	YP_003679299
Protein GI	297560325
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.307565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.298567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGTGG TCAACAACCT GCCCAACGCC GTCCAGGAGG ACGAGCACCT GTGGATACCG 
ATGTCGGACG GTGTGCACCT GGCCGCCAGG GTGTGGCGGG CGACCTCCTC CGACGTGTCC 
CCCGTCCCGG CGGTCCTGGA GTACCTCCCC TACCGCAGGC GCGACCTGAC GTCGGTGCGC 
GACTCCATGC ACCACCCCTA CATCGCCGGG CACGGCTACG CCTGCGTCCG CGTGGACCTG 
CGGGGTACCG GTGACTCGGA GGGCGTGCTC ACCGACGAGT ACCTGGAGCG CGAGCAGCTG 
GACGCCGAGG AGGTGCTGGC CTGGCTGGCC GAGCAGCCCT GGTGCAACGG GAAGACCAGC 
ATGATGGGGC TGTCCTGGGG AGGGTTCGCC GCGCTCCAGG TGGCGGCCCG CCAGCCCCCG 
AGCCTGGGCG CGATCGTCAT CAGCTCCTTC ACCGACGACC GGTACGGCGA CGACTTCCAC 
TACATGGGCG GTTGTCTGCT GTCGGACAAC CTCGCCGAGG CGGGGACGAT GTTCTCCGCG 
GGCACCTGCC CGCCGGACCC GGTGACCGTC GGCGACGACT GGCGGCGGAT GTGGCACGAG 
CGGCTGGAGG CCACCGAACC GTGGGTCCTG GAGTGGCTGC GCCACCAGCG GCGCGACGAC 
TACTGGCGGC ACGCGTCGGT GAGCGAGGAC TACTCGAAGG TGCGCTGCCC GGTGCTGGCC 
TCCAGCGGGT GGGCGGACGG CTACTCCAAC GCCGTCTTCC GGCTGCTGGA GAACCTGGAG 
GCGCCCAGGC GGGGGCTGAT CGGCCCGTGG TCGCACCGCT ACCCGCACAT GGGCAGCCCC 
GGCCCGGCGA TCGGCTACCT CCAGGAGGTC GTGCGCTGGC TGGACCGCTG GCTCAAGGAC 
AGGGAGAACG GTGTCGACGA GGGCCCGTCC CTGTGGGCGT GGATGCAGGA CAGCGTGCTC 
CCCTCCACCG CCTACACCGA GCGCCCCGGC CGGTGGGTGC GCGAGGACGT GTGGCCCTCG 
CCGAGCGTGG AGTACCGCGG CTACCCGCTG GCCAGGTACC GGATCGGCCG CCCCGGAGAG 
GAGGTGCACT CGGAGTCGCT GACCGTGCGG TCGCCGCTGA CCGTGGGCCA GTTCGCGGGC 
AAGTGGGCCT CCTACAACGC CCCGCCGGAC CTGCCCTACG ACCAGCGCGA GGAGGACGGC 
GGTTCCCTGG TCTTCGACAG CGACGTGCTG TCGGAGGACG TGGAGATCCT GGGCGCCGCC 
GAGGTGGAGC TGGACGTGTC GGTCACCGAG CCGGTGGCCA TGGTCGCCGC GCGGCTGGTG 
GACGTCGCGC CGGACGGCAG CGCCACGCGG GTGACCTACG GGCTGCTCAA CCTCACCCAC 
CGCGACGGCC ACGAGCACCC CGAGAAGCTC GAACCCGGTG AGATCTACCG GGTGAAGGTC 
ACGATGAACG GTGTCGCGCA GGCGTTCCCG GTGGGGCACC GCATCCGGCT GTCGCTGTCC 
ACCTCCTACT GGCCGCTGGC CTGGCCGCCG CCCAAGCCCG CCCTGCTGAC CGTGCACCCG 
GAGAACAGCA GGCTGCTGCT GCCGGTGCGT CCTCACTCCG AGGCGGACGA GCCGCACCCG 
GAGCCCTTCG GGGAGCCGGA GGCGGCGCCG GAGATCTCCA CCACGCGCCG GGAGAAGCCG 
GAGCACAGCT GGACCGTCTA CAGGGACCTG GTGGACACCC GGTCGGCCCT GGAGATCGTC 
AAGGACGGCG GCATCCTGCA CTTCGACGAC ATCGACCTGG ACGTCGGTCG GCGCGCCTAC 
GAGTACTACG AGTCCGTGGC GGGCGACTTC ACGTCCGCGC GCGGTGAGTC GACGTGGACG 
ATGCGCTTCG CGCGGGACGG GTGGCGGACC CGGACCGAGA CCCACACGTC GCTGGAGTGC 
ACCGAGACCG AGTTCCGGGT GTACGCGACT CTGGACGCGT TCGAGAACGA CGAGCGGGTC 
TTCTCCCGGC AGTGGACCGA GACGCTGCCC CGGGACCACC TGTGA

Protein sequence

MHVVNNLPNA VQEDEHLWIP MSDGVHLAAR VWRATSSDVS PVPAVLEYLP YRRRDLTSVR 
DSMHHPYIAG HGYACVRVDL RGTGDSEGVL TDEYLEREQL DAEEVLAWLA EQPWCNGKTS 
MMGLSWGGFA ALQVAARQPP SLGAIVISSF TDDRYGDDFH YMGGCLLSDN LAEAGTMFSA 
GTCPPDPVTV GDDWRRMWHE RLEATEPWVL EWLRHQRRDD YWRHASVSED YSKVRCPVLA 
SSGWADGYSN AVFRLLENLE APRRGLIGPW SHRYPHMGSP GPAIGYLQEV VRWLDRWLKD 
RENGVDEGPS LWAWMQDSVL PSTAYTERPG RWVREDVWPS PSVEYRGYPL ARYRIGRPGE 
EVHSESLTVR SPLTVGQFAG KWASYNAPPD LPYDQREEDG GSLVFDSDVL SEDVEILGAA 
EVELDVSVTE PVAMVAARLV DVAPDGSATR VTYGLLNLTH RDGHEHPEKL EPGEIYRVKV 
TMNGVAQAFP VGHRIRLSLS TSYWPLAWPP PKPALLTVHP ENSRLLLPVR PHSEADEPHP 
EPFGEPEAAP EISTTRREKP EHSWTVYRDL VDTRSALEIV KDGGILHFDD IDLDVGRRAY 
EYYESVAGDF TSARGESTWT MRFARDGWRT RTETHTSLEC TETEFRVYAT LDAFENDERV 
FSRQWTETLP RDHL