Gene Ndas_3778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3778
Symbol
ID	9247647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4540899
End bp	4542107
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	71%
IMG OID
Product	amidohydrolase
Protein accession	YP_003681682
Protein GI	297562708
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.509306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCG CGATCACATC CGGATACGTC GTTCCCGTCG ACGGAGACCC CATCGACGGG 
GGCACCGTCC TCATCTCCGA CGGCCGGATC GCCGCCGTCG GCGCCGACGT CACGGTCCCC 
GAGGGGGCCA CCGTCGTCGA CGCCTCCGGC AAGTGGGTGC TCCCCGGCTT CGTGGAGGCC 
CACGGCCACA TCGGCATCGA CGAGGAGGGC GTCGGCTGGG CCGGTGACGA CACCAACGAG 
ATGACCGACC CCAACGGCGC CCGCATGCGC GCGCTGGACG CCATCAACCC CGCCGACCGC 
GGCTTCGCCG ACGCCCTGTC CGGAGGCGTC ACCAGCTCGG TCGTCAAGCC CGGTTCGGGC 
AATCCCATCG GCGGCCAGAC CGTGGCGATC AAGTGCTGGG GCCGCAGCAT GGAGGACCGC 
CTGATCCGGC ACCCGGCCAG CGTCAAGAGC GCCCTGGGCG AGAACCCCAA GCGGGTCTAC 
GGCAACAAGG ACAAGCTGCC CTCCACCCGC CAGGGCGTGG CCGCCGTCAT CCGCGACGCC 
TTCACCAGGG CCCAGGACTA CCGGGCCAGG CGCGAGCACG CGGCCTCGGA GGGCACCCCG 
TTCGAGCGGG ACACCACCCT GGAGGTGCTG GTCCGGGTCC TGGACGGCGA ACTCCCCTGG 
TGCCAGCACA CGCACCGCGC CGACGACATC CACACCGCGA TGCGCCTGTC CGACGAGTTC 
GGCTACCGGC TGATCATCAA CCACTGCACC GAGGGCCACC TGCTGGCCGA CGAGATCGCC 
GCGCGCGGCA TCCCCGTCAT CACCGGTCCG CTCATGACCA GCCGCTCCAA GGTCGAGGTC 
AACAACAAGA CCCTGGCCAA CCCCGGCATC CTCGACCGGG CGGGCGTCAA GGTCGCCCTG 
ACCACCGACC ACCCGGTCGT CCCGATCGAG TTCCTGGTCC ACCAGGCCAC CCTGTGCGTC 
AAGGAGGGCA TGGACCCGCG CTCCGCGATC CGCGCCCTCA CGGTCAACCC CGCCGAGATC 
ATGGGCATCT CCGACCGGGT CGGCTCCCTC AAGCCGGGCC TGGACGCCGA CGTGGTCGTG 
TGGTCGGGCG ACCCGCTGGA CGTGATGAGC CGCGCCCTGC GCGTGTTCGT CGAGGGCCGC 
GAGGTCTACA CCTACGACGA GGCCACACGC GAGCGCACCG TGCTCGACGC CTACTACCGC 
GAGGGGTGA

Protein sequence

MDIAITSGYV VPVDGDPIDG GTVLISDGRI AAVGADVTVP EGATVVDASG KWVLPGFVEA 
HGHIGIDEEG VGWAGDDTNE MTDPNGARMR ALDAINPADR GFADALSGGV TSSVVKPGSG 
NPIGGQTVAI KCWGRSMEDR LIRHPASVKS ALGENPKRVY GNKDKLPSTR QGVAAVIRDA 
FTRAQDYRAR REHAASEGTP FERDTTLEVL VRVLDGELPW CQHTHRADDI HTAMRLSDEF 
GYRLIINHCT EGHLLADEIA ARGIPVITGP LMTSRSKVEV NNKTLANPGI LDRAGVKVAL 
TTDHPVVPIE FLVHQATLCV KEGMDPRSAI RALTVNPAEI MGISDRVGSL KPGLDADVVV 
WSGDPLDVMS RALRVFVEGR EVYTYDEATR ERTVLDAYYR EG