Gene Ndas_4045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4045
Symbol
ID	9247917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4837459
End bp	4838589
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	75%
IMG OID
Product	alanine racemase
Protein accession	YP_003681948
Protein GI	297562974
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.43554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCACT TCGCGCACGC TCGCGTCGAC CTCGACGCGA TCTCCCACAA CGCGCGGGTG 
CTCCGCGGGT TCGCAGGGGG CACCCCGCTC ATGGGTGTGG TCAAGGCCGA CGGCTACGGG 
CACGGCATGC TCCCGGCAGC CCGCGCCCTG ATCGCGGGCG GCGCGACCTG GCTGGGCACG 
GCCTTCATCG GCGAGGCCCT CGAACTGCGC CGCGCCGGAC TGACCCCGCC CGTCCTGGCC 
TGGATCATCC CGCCCGGCGA GCCGGTCGCG GAGGCCGTCG AGGCCGACAT CGACCTCGGG 
GTGAGCGACC GCGCGGTCCT GGACACCGTG ATCGCCGAGG CCCGCCGCAT CGGCCGCACC 
GCCCGCGTAC AGCTCAAGGC CGACACCGGC CTCAACCGCG GCGGCGTGGG TCCCGCCGAC 
TGGGGCGCCC TGGCCGAGGC CGCCGCCCGC GCCGAGGACG AGGGGCACCT GCGCGTCACC 
GGCGTGTGGT CCCACTTCGC CTGCGCCGAC GAGCCGGGCC ACCCCTCCGT CGCACGCCAG 
CTCTCCCGCT TCCACGAGGC CCTGGAGACC GCGGACAAGG TCGGCCTGAC CCCCGAGGTC 
CGGCACATCG CCAACTCGGC CGCGCTGCTC ACCCTCCCCG AGGCCCGCTT CGACCTCGTC 
CGCGGCGGGA TCGCCAGCTA CGGCCTGAGC CCGATCCCCG GCCTCACGGG GACCGGGCTG 
CGGCCCGCGA TGACGCTGCG CTCCCGGCTC GCCCTCACCA AGCGCGTCCC CGAGGGCAGC 
GGCGTCTCCT ACGGCCACCG CTACGTGACC GACCGGGAGA CCACCCTGGC CCTGGTGCCG 
CTGGGTTACG CCGACGGGGT CCCCCGCGCC GCCACCAACC GGGGGCCCGT CCTCCTGGGC 
GGACGCCGCC GGGCCGTCGC GGGAACGGTC TGCATGGACC AGTTCGTCGT GGACGTCGGC 
GACGACGCCG TGGAGGCCGG TGAGTACGCG GTGCTCTTCG GCAACCCCGA GGACCACCCG 
GACACCCCGA CCGCCGAGGA CTGGGCCGAG ATCCTGGACA CTATCCCGTA CGAGATCGTC 
ACGCGGGTGG GCCCCCGGGT CCCGCGCGAG TACGTCGGCG GGGGCGCCTG A

Protein sequence

MSHFAHARVD LDAISHNARV LRGFAGGTPL MGVVKADGYG HGMLPAARAL IAGGATWLGT 
AFIGEALELR RAGLTPPVLA WIIPPGEPVA EAVEADIDLG VSDRAVLDTV IAEARRIGRT 
ARVQLKADTG LNRGGVGPAD WGALAEAAAR AEDEGHLRVT GVWSHFACAD EPGHPSVARQ 
LSRFHEALET ADKVGLTPEV RHIANSAALL TLPEARFDLV RGGIASYGLS PIPGLTGTGL 
RPAMTLRSRL ALTKRVPEGS GVSYGHRYVT DRETTLALVP LGYADGVPRA ATNRGPVLLG 
GRRRAVAGTV CMDQFVVDVG DDAVEAGEYA VLFGNPEDHP DTPTAEDWAE ILDTIPYEIV 
TRVGPRVPRE YVGGGA