Gene Ndas_0319 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0319
Symbol
ID	9244154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	395244
End bp	396302
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	72%
IMG OID
Product	threonine synthase
Protein accession	YP_003678273
Protein GI	297559299
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.147741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGGG CGTGGCGAGG CATCGTCGAG GAGTACCGCG ACCGCCTCCC CGTCAACGAG 
AGCACCCCCG TTGTCACCCT CCAGGAGGGC GGCACGCCCC TGCTGCCCGC CACGCGCGTG 
TCCGAGCTCA CGGGCTGCGA GGTCTTCCTC AAGGTCGAGG GGCTCAACCC CACCGGGTCC 
TTCAAGGACC GCGGCATGAC CATGGCCATC ACCAAGGCCG CCGAGGACGG CGCCAAGGCC 
GTCATCTGCG CCTCCACCGG CAACACCAGC GCCAGCGCCG CCGCCTACGC CATCCGCGCG 
GGCATGACCT GCGCCGTGCT GGTGCCCCAG GGCAAGATCG CCATGGGCAA GCTGGCCCAG 
GCCCTCGTCC ACGGCGCCCG CCTGCTCCAG GTCGACGGCA ACTTCGACGA CTGCCTCGAA 
CTGGCCCGCA AGCTCAGCGT GGACTACCCG GTCGCCCTGG TGAACTCGGT CAACCCCTAC 
CGCCTCCAGG GGCAGAAGAC CGCCGCCTTC GAGATCGTCG ACGCCCTCGG CGACGCCCCC 
GACGTCCACT GCATCCCCGT GGGCAACGCG GGCAACATCA CCGCCTACTG GATGGGCTAC 
ACCGAGTACT CCAGGGACGG GATCTCCACC CGCAACCCGC GCATGCTCGG CTTCCAGGCC 
AGCGGCTCCG CGCCCATCGT CAACGGCGCG CCCGTCACCA GCCCGAGCAC CATCGCCACC 
GCCATCCGCA TCGGCAACCC GGCCTCCTGG AAGCTGGCCG AGCAGGCCCG CGACGAGTCC 
GGCGGCCTCA TCGACAAGGT CACCGACCGC CAGATCATGG CCGCCTACAA GCTCCTCGCC 
GCCGAGGAGG GCGTGTTCGT GGAGCTGGCC TCCGCCGCCA GCGTGGCCGG TCTGCTCCAG 
TCCGTCCAGG CGGGGCTGGT CGAGCCCGGC AGCCGCGTGG TGTGCACCGT GACCGGCAAC 
GGCCTCAAGG ACCCCGACTG GGCGCTGGCC GGAGCCTCCT CCGCCACCAC CGTCCCGGTC 
GACGCCCTCG CCGCGGCCCA GGCCCTCGAC CTGGCCTGA

Protein sequence

MARAWRGIVE EYRDRLPVNE STPVVTLQEG GTPLLPATRV SELTGCEVFL KVEGLNPTGS 
FKDRGMTMAI TKAAEDGAKA VICASTGNTS ASAAAYAIRA GMTCAVLVPQ GKIAMGKLAQ 
ALVHGARLLQ VDGNFDDCLE LARKLSVDYP VALVNSVNPY RLQGQKTAAF EIVDALGDAP 
DVHCIPVGNA GNITAYWMGY TEYSRDGIST RNPRMLGFQA SGSAPIVNGA PVTSPSTIAT 
AIRIGNPASW KLAEQARDES GGLIDKVTDR QIMAAYKLLA AEEGVFVELA SAASVAGLLQ 
SVQAGLVEPG SRVVCTVTGN GLKDPDWALA GASSATTVPV DALAAAQALD LA