Gene Ndas_5170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5170
Symbol
ID	9249063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	313211
End bp	314620
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	73%
IMG OID
Product	dihydropyrimidinase
Protein accession	YP_003683056
Protein GI	297564083
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGAC GCACCGTCAT CCGCGGCGGC CTGGTCGTCA CCGCGGCCGA GGAGACCGAG 
GCCGACGTCC TGGTGGAGGG CGAGAGGGTG GCCGCGCTCG CGCTGCGCGG CAGCGACGCC 
GCCCGCTCCT GGGCCGACAG CGGCGCCGAG GTCATCGACG CCGCCGGGCA CTACGTCGTC 
CCCGGCGGGG TGGACGGCCA CACCCACATG GAGATGCCCT TCGGCGGCAC CTCCTCCTCC 
GACACCTTCG AGACGGGCAC CCGGGCCGCA GCCTGGGGCG GCACCACCAC GATCGTCGAC 
TTCGCCATCC AGCGGCCCGG GGAGTCGGTG CGCGCGGGCG TGGACGCGTG GATGGCCAAG 
GCCGAGGGCA ACTGCGCGGT GGACTACGCC TTCCACGCGA TCCTCTCCGA CGTCAACGCC 
TCCTCGCTCG GGGAGATGGA CGCCCTCGTC GGCGAGGGCG TGACCTCGTT CAAGCTGTTC 
ATGGCCTACC CGGGCGTGTT CTACAGCGAC GACGGCCGGA TCCTGCGGGC CATGCAGCGC 
GGCGCCGCCA ACGGCGCGCT GACCATGGTG CACGCCGAGA ACGGCATCGC CATCGACGTG 
CTGGTCGAGC AGGCCCTGGC CGAGGGCAGG ACCGACCCGA GGTACCACGG CGAGGTGCGC 
AGGGCCCTGC TGGAGTCGGA GGCCACCCAC CGCGCCGTCC AGCTCGCCCG GGTGGCGGGC 
GCGCCGCTGT ACGTGGTGCA CGTCTCGGCG CGGGAGGCGG TGGAGGAGCT GGCCCGGGCG 
CGCGGGATGG GGCTCAACGT GTTCGGCGAG ACCTGCCCCC AGTACCTGTT CCTGTCCGCC 
GACAACCTCG CCGAGCCTGG ATTCGAGGGC GCCAAGTACG TGTGCTCCAC TCCTCTGCGG 
CCCCGGGAGC ACCAGGAGCA CCTGTGGCGA GCGCTGCGCA CCAACGACCT GTCCGTGGTC 
TCCACCGACC ACTGCCCGTT CTGCTTCGCC GGGCAGAAGG AGCTGGGCCG GGGCGACTTC 
TCCAGGATCC CCAACGGCAT GCCCGGGGTC GAGCACCGCA TGGACCTGCT GCACCAGGCC 
GTGGTGGAGG GCCGCATCGG CAGGCGCCGG TGGATCGAGA TCGCCTGCGC CACCCCGGCC 
CGCATGTTCG GCCTGTACCC GGCCAAGGGC ACGATCTGCC CGGGCTCGGA CGCCGACATC 
GTGGTCTACG ACCCACGCGC CGAGCAGGTC CTGTCGGCCG AGACGCACCA CATGAACGTG 
GACTACTCGG CCTACGAGGG CAGACGGGTC ACCGGCCGGG CCCGCACCGT GCTCTCGCGC 
GGCCGGGTCG TGGTGGACCG CGGCGCCTAC CTGGGCGAGG CCGGGCACGG CCGGTACGTG 
CCCCGGTCCA CCTGCCAGTA CCTGGTCTGA

Protein sequence

MARRTVIRGG LVVTAAEETE ADVLVEGERV AALALRGSDA ARSWADSGAE VIDAAGHYVV 
PGGVDGHTHM EMPFGGTSSS DTFETGTRAA AWGGTTTIVD FAIQRPGESV RAGVDAWMAK 
AEGNCAVDYA FHAILSDVNA SSLGEMDALV GEGVTSFKLF MAYPGVFYSD DGRILRAMQR 
GAANGALTMV HAENGIAIDV LVEQALAEGR TDPRYHGEVR RALLESEATH RAVQLARVAG 
APLYVVHVSA REAVEELARA RGMGLNVFGE TCPQYLFLSA DNLAEPGFEG AKYVCSTPLR 
PREHQEHLWR ALRTNDLSVV STDHCPFCFA GQKELGRGDF SRIPNGMPGV EHRMDLLHQA 
VVEGRIGRRR WIEIACATPA RMFGLYPAKG TICPGSDADI VVYDPRAEQV LSAETHHMNV 
DYSAYEGRRV TGRARTVLSR GRVVVDRGAY LGEAGHGRYV PRSTCQYLV