Gene Ndas_5375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5375
Symbol
ID	9249278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	556451
End bp	557659
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	74%
IMG OID
Product	alanine racemase
Protein accession	YP_003683261
Protein GI	297564288
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTCGA CCGACCCCGG GGAGCACTCG CTCCACCTCC CCGGCCACCC GGCCTCGCCC 
CTGGGTGAGG CCCTCGTTGA TATAAGCGCG ATCGCCCACA ATGTACGGTT CATGGCAAAG 
CGGACCAATT CCGAAATTCT TGCCGTCGTC AAGGCGAACG GCTTCGGCCA CGGGGCCGTG 
GAGGTCGCCC GCGCCTCCCT GGAGGCCGGA GCGACCTGGC TGGGCGTGAC CTCCCTGGAG 
GAGGCGCTCG CCCTGCGCCG CGCCGGGCTG CGCGCCCCCG TGCTGTGCTG GCTGCACCGT 
GCGGACCAGG ACTTCGACTC CGCCGTCGCC GCCGACGTGG ACCTGTCCGT CCCCTCGGTC 
GGCCACCTGC GCGCCGTGGC CGACGCCGCC GTGCGCACGG GCCGTGTCGC GCACGTCCAC 
CTCAAGGCCG ACACCGGGCT GAGCCGCAAC GGCGCGCCGC CGGACGCCTG GCCCGGACTG 
GTCGGTCTGG CCCGCGTACT GGAACTGGAC GGCCTGGTCC GGGTGCGCGG TGTCTGGTCA 
CACCTGGCCT CCGCCGACCT GCCCGGCGCG GCGACCACCG CGCAGCAGGT CACCGCCTTC 
GAGGGGGCGC TCTCCCAGGC GCGCGCGGCC GGGCTCGACC CGTCGCTGCG GCACCTGGCC 
AACACGGCCG CGATCCTCAA CGAGCCCGCC ACGCACTTCG ACCTGGTCCG GGCGGGCGTC 
GGCCTCTACG GAGTGGAGCC GGTCGAGGGC AGGCGCTTCG GCCTGCGCCT GGCCATGACC 
CTGCGCGCCC GGGTGGCCAT GGTCCGCCGG GTCCCCGCGG GGACGGGCGT CAGCTACCAC 
CACGCCTACA CCACCCCACG CGAGAGCCTG CTCGCCCTCG TCCCGCTCGG CTACGCCGAC 
GGTGTGCCCC GTGCGGCGGG GGACCGGGCC TACGTGTGGA TCGCCGGACG GCGGTGCCCC 
GTGGCCGGAC GCATCGCCAT GGACCAGTTC GTGGTCGACG TCGGCGGCAT GGACGTGCGC 
GAGGGCGACG AGGTGGTCGT GTTCGGCCCC GGCGACCGCG GCGAGCCCAC CGTCGAGGAG 
TGGGCCGACT GGGCCGGAAC CATCCCCCAC GAGATTCTCA CCGGCGTGGG TGCGCGCGTG 
CCCCGCCTCC ACCAGGACCT GGCGCGGCCC GTGCCGCGCG AACCGAGCAA GGAGAGATCG 
AGTGCCTGA

Protein sequence

MPSTDPGEHS LHLPGHPASP LGEALVDISA IAHNVRFMAK RTNSEILAVV KANGFGHGAV 
EVARASLEAG ATWLGVTSLE EALALRRAGL RAPVLCWLHR ADQDFDSAVA ADVDLSVPSV 
GHLRAVADAA VRTGRVAHVH LKADTGLSRN GAPPDAWPGL VGLARVLELD GLVRVRGVWS 
HLASADLPGA ATTAQQVTAF EGALSQARAA GLDPSLRHLA NTAAILNEPA THFDLVRAGV 
GLYGVEPVEG RRFGLRLAMT LRARVAMVRR VPAGTGVSYH HAYTTPRESL LALVPLGYAD 
GVPRAAGDRA YVWIAGRRCP VAGRIAMDQF VVDVGGMDVR EGDEVVVFGP GDRGEPTVEE 
WADWAGTIPH EILTGVGARV PRLHQDLARP VPREPSKERS SA