Gene Ndas_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0420
Symbol
ID	9244259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	508291
End bp	509547
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	75%
IMG OID
Product	amidohydrolase
Protein accession	YP_003678373
Protein GI	297559399
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCC AGTCAGAACC GCACATCCTC TTCACGGGCG CCGGGCTGCT CGACCCCGAG 
GCGGGCACGA GGACCCCCGG CTCCTGGCTC CTGGTGCGGG ACGGCCTCGT CGCGGGCAGC 
GGCCGGGGAA CCCCGCCCGA GGTGGGACCG CGGGTGCCGA CCGTGGACGT GGCGGGGGCC 
ACCCTCATGC CGGGCCTGAT CGACGCCCAC GTGCACCCGA CCGCCTTCAG CGCCGACCTC 
GGCGCCGCGA TGGACCAGTC GCCCGCCTAC ATCGCCAGCT ACGCGGGACG GTCCCTGGGC 
GACATGCTCA GGCGCGGCTT CACCACCGTC CGCGACGTCG CCGGGGGCGA CTGGGGGCTG 
GCCAGGGCGG TCGAGGAGGG GCTCGTCGAC GGCCCCCGGC TCATGTTCGG CGGCAAGGCG 
CTGTCGCAGA CCGGCGGCCA CGGCGACTTC CGCACGCCCG GCCGCCAGGG CAACGACACC 
CACGCCTGCT GCCCCGGCGC GGGCATCGTC TGCGACGGGC CCGTGGAGTT CCGCCGCGCG 
GCCCGCGAGC AGCTGCGCAC CGGAGCCCAC CACCTCAAGA TCATGCTCTC GGGCGGCGTC 
GCCTCCCCCA CCGACCGCAT CGACTCCACC CAGTCCTCCG AGGACGAGAT CCGGGCCGTG 
GTGGAGGAGG CCGAGGCGGC CAACCGCTAC GTGACCGGCC ACGCCTACAC CGCCCGCGCC 
GTCAACCGCG GGCTCCGCCT CGGCGTGCGC TGCATCGAGC ACGGCAACCT CATCGACGAG 
AGCAGCATCG AGCTGTTCCT GGAGCACGAC GCCTACCTGG TGCCCACCCT GGTCACCTAC 
CAGGAACTCT CCCGGCAGGG GGCCGCCAAC GGGCTGCCCG CGGCCAGCCA GGCCAAGGTG 
GACACCGTGC TCGACCGGGG GCTGGACGCC CTGCGCATGG CCCACGAGGC CGGGGTGAAC 
CTGGTCTTCG GCAGCGACCT GCTCGGCGGC ATGCAGGACC GCCAGAGCCA GGAGTTCGCC 
ATCCGCGGCC GGGTCCAGCC CGCCGCGGAC GTGCTGCGCG CCGCCACCGT CAACGCCGCC 
CGCCTGCTGG GGCTGGAGGG GGTCGTCGGA ACCCTGCGCG ACGGGGCGCG GGCCGACCTC 
GTCGTGGTCG ACGGCGACCC GCTCACCGAC ATCGGGGTCC TGGCCTCGCC GGAGACGAGC 
GTGCGCACCG TGCTGCGCGA CGGCCGGATC CGCCACGAGC GCGACGCCGT GCGCTGA

Protein sequence

MTRQSEPHIL FTGAGLLDPE AGTRTPGSWL LVRDGLVAGS GRGTPPEVGP RVPTVDVAGA 
TLMPGLIDAH VHPTAFSADL GAAMDQSPAY IASYAGRSLG DMLRRGFTTV RDVAGGDWGL 
ARAVEEGLVD GPRLMFGGKA LSQTGGHGDF RTPGRQGNDT HACCPGAGIV CDGPVEFRRA 
AREQLRTGAH HLKIMLSGGV ASPTDRIDST QSSEDEIRAV VEEAEAANRY VTGHAYTARA 
VNRGLRLGVR CIEHGNLIDE SSIELFLEHD AYLVPTLVTY QELSRQGAAN GLPAASQAKV 
DTVLDRGLDA LRMAHEAGVN LVFGSDLLGG MQDRQSQEFA IRGRVQPAAD VLRAATVNAA 
RLLGLEGVVG TLRDGARADL VVVDGDPLTD IGVLASPETS VRTVLRDGRI RHERDAVR