Gene Ndas_0410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0410
Symbol
ID	9244249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	502231
End bp	503478
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	76%
IMG OID
Product	alanine racemase domain protein
Protein accession	YP_003678364
Protein GI	297559390
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.844153
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTGGC ATGCTCAGGA CATGACAAGT CTGCGCGAAA CGTACGAGTC CGCCACACGC 
GGACTCGAAG CCCCCTTCGC CCTCGTCGAC CTCGCCGCCC TGCGCTCCAA CGCGGCCGAC 
CTGACCCGCC GCGCCCACGG CAGGCCCATC CGGATCGCCA GCAAGTCCGT GCGCAGCCGC 
GAACTGCTGC GCACCGTCCT CGCCCTGCCC GGCTACGCGG GCGTCATGGC CTTCACCCTG 
CCCGAGGCCC TCTGGCTGGC CACCGGCGAC CGCCCCCTCA GCGACGACGT CCTCGTCGCC 
TACCCCACCG TCGACCGCCA GGCCCTGGCC AGGCTCGTGC GCGACCCCCG CGCCGCCCGC 
GCGATCACCC TGATGGTGGA CGACACCGCG CACCTGGACC TGATCGGCGC CGCCGTCGCC 
GACGCCGCCG AATCCCGCGG CCCCGACGCC CCGCCGGTCC GGGTGTGCCT GGACGTCGAC 
ACCAGCTGGC AGCCCGTGGG ACCGCGCCTG CGCGTGGGCA CCTACCGCTC CCCCGTGCGC 
ACCCCGGCCC AGGCCGCCGC GTTCGCCCGC GCGGTCGCGG CCCGCCCCGG ACTGGAGCTG 
GACGGGATCA TGGCCTACGA GGGCCAGATC GCCGGGGTGG GCGACGCCCC GCCCGGCAGA 
CCGCTCTACG GACGCCTCCT GCGCGCCGTC CAGCGCCGCT CGGCCGTGGA GCTGGCCAAG 
CGCCGCGCCG CCATCGTCCA CGCCGTCAGG GAGGTCGCCG ACCTGCGCTT CGTCAACGGC 
GGCGGCACCG GCAGCCTGCA CACCACCGGC CGGGAGAGGG CCGTGACCGA GCTGGCGGCG 
GGCTCGGGGC TCTACCACCC GCACCTGTTC GACCACTACC GCTCCTTCGG CGGACGCCCC 
GCCGCCCTGT TCGCGCTCCC CGTCGTGCGC CGGCCCGGAC CGGGCGTGGC CACCGCCCTG 
GGCGGCGGCT ACCCCGCCTC GGGCCCCGTG AACGCCCACC GCGCCCCGCT CCCCCACCTG 
CCCGCCGGGC TCTCCTACAG CGTCAACGAG GGCGCGGGCG AGGTGCAGAC GCCCCTGCTC 
GGCGCCGCGG CCGACGGCCT GTCCGTCGGC GACCGGGTGT GGATGCGCCA CGCCAAGGCG 
GGAGAACTGT GCGAGCGCTT CGACACCCTG CACCTGGTGG ACTCCGACAC CGGCGAGTAC 
GCGGGCGCCG TGCCCACCTA CCGGGGCGAG GGCCAGACCT TCCTTTGA

Protein sequence

MFWHAQDMTS LRETYESATR GLEAPFALVD LAALRSNAAD LTRRAHGRPI RIASKSVRSR 
ELLRTVLALP GYAGVMAFTL PEALWLATGD RPLSDDVLVA YPTVDRQALA RLVRDPRAAR 
AITLMVDDTA HLDLIGAAVA DAAESRGPDA PPVRVCLDVD TSWQPVGPRL RVGTYRSPVR 
TPAQAAAFAR AVAARPGLEL DGIMAYEGQI AGVGDAPPGR PLYGRLLRAV QRRSAVELAK 
RRAAIVHAVR EVADLRFVNG GGTGSLHTTG RERAVTELAA GSGLYHPHLF DHYRSFGGRP 
AALFALPVVR RPGPGVATAL GGGYPASGPV NAHRAPLPHL PAGLSYSVNE GAGEVQTPLL 
GAAADGLSVG DRVWMRHAKA GELCERFDTL HLVDSDTGEY AGAVPTYRGE GQTFL