Gene Ndas_4219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4219
Symbol
ID	9248093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5036900
End bp	5038360
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	72%
IMG OID
Product	alpha/beta hydrolase fold protein
Protein accession	YP_003682117
Protein GI	297563143
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCCTCG CCCGAAGCGC CGCGCTGGCC GCGGCCTCCG GACTGTTGCT CACCGGCGTT 
GCCGCCCCCG CCTCGGCAAC CCCGGGCCCG GAACCGGAGT GGCGGCTGTG CTCCGACGTC 
GCCCGGGGGT GGGACGGGAA CGACGACCGC ACCCTGTGCG CCACCGTCCC GGTGCCCTTG 
GACCACGAGG ACCCCGACGG GCGCACGATC GGCATAGCGG TGACCCGTGT GCCCGCCACC 
GGGGAGAACA CCTATCCCAT CCTGTTTAAC CCCGGCGGCC CGGGGCATCC GGGCGTGACC 
ATGCCCGGGC GCATCCTCGA CAGCGAGGCC GCGGACCTGG CGCTGGACCA CGACCTCGTG 
GGCTTCGATC CGCGCGGCGT GGGTTACAGC GACGCCGTGG AGTGCGGTCT GGAGGGGACC 
GCCCCCGACC CCGGCCTGAG CGACGAGGAG AGCGCACGGC ACGTCGCCGA GGAGCAGAGC 
CGGATCAATC GCGAATGCCA CGCCCGGGAT CCCGAGTTCG TGGACTCGCT GACCGCGGAG 
AACGTGGCCC GGGACATGGA TCTGATCCGC GAGGCGCTGG GAGCGGAGAC GATCGGTTTC 
TACGGAGTGT CCTGGGGAAC CCTGCTCGGC GCCGCCTACA GGTCGATGCA CGACGACCGG 
GTCGAGGCCA TGCTCCTGGA CTCGGTGATG TCGCCCGAGG CCAGTGTCAC CATGTTGGAC 
GAGGGGCAGG CCATGGCCGC CCAGGCCGCG TTCCACCGCT TCACCGACTG GCTGGCCGAG 
CACGACGACC ACTACGGGCT CGGCACGGAG TCCGACCGCA TCCGGGACGA GGTCTACGGG 
CTGCGGGAGG AACTGGCCGA TGAGCCCCGC ACCGGCCCCG ACGGGACGGT CGTCGACGGC 
GGCGCCGTGA CCGCGCTGCT GGCCACCCCC GAACGCGAAT GGCCCGCCAA CGCCCGCTCC 
CTCGTCACGC TCCTCGACGG AGGCGTGCCC GGGACAGGGG TCGCCCGCGG ACCGGTCTCC 
GGCGCCGGTT GGGACTCCGA ACCCGTCTTC GACGCCTTCG CGCAGGTGTC ACTGCTCTGC 
AACGACTCCG ACAGCCCGCG CGACTTCGAC CAGGTGTGGC AGCACCGGTT GGAGCGGGCC 
GAACGGTACC CCGTCATGGG CACCCTGGGC TTCTACGAGC ACTCCTGTGT CGGCTGGCCC 
GAGGAGGGCG CGGCTCCCGA CCTGACCCAC GGGGACAGCC CTCTGCAACT GGTGGGCCAC 
GTCAACGAGA TGGTCACCCC GCACGACTGG GCGCTGGACA TGAGGCGGGT CGTCGGCGGA 
GAGGTCATGA GTGTGGAGGA CGACGGGCAC GGGACCCTGT CGGGCCTGGA CTGCGCCGCG 
GCGGCCGTGG ACTTCTTCAA CACCGGGCGG ACCACCACGC GAACGTGCCC GGGACCGCCC 
GCGCCGACTC CCGAGGGCTG A

Protein sequence

MLLARSAALA AASGLLLTGV AAPASATPGP EPEWRLCSDV ARGWDGNDDR TLCATVPVPL 
DHEDPDGRTI GIAVTRVPAT GENTYPILFN PGGPGHPGVT MPGRILDSEA ADLALDHDLV 
GFDPRGVGYS DAVECGLEGT APDPGLSDEE SARHVAEEQS RINRECHARD PEFVDSLTAE 
NVARDMDLIR EALGAETIGF YGVSWGTLLG AAYRSMHDDR VEAMLLDSVM SPEASVTMLD 
EGQAMAAQAA FHRFTDWLAE HDDHYGLGTE SDRIRDEVYG LREELADEPR TGPDGTVVDG 
GAVTALLATP EREWPANARS LVTLLDGGVP GTGVARGPVS GAGWDSEPVF DAFAQVSLLC 
NDSDSPRDFD QVWQHRLERA ERYPVMGTLG FYEHSCVGWP EEGAAPDLTH GDSPLQLVGH 
VNEMVTPHDW ALDMRRVVGG EVMSVEDDGH GTLSGLDCAA AAVDFFNTGR TTTRTCPGPP 
APTPEG