Gene Ndas_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3040
Symbol
ID	9246896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3635421
End bp	3636719
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	70%
IMG OID
Product	tyrosyl-tRNA synthetase
Protein accession	YP_003680956
Protein GI	297561982
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.485663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACA TCATCGACGA ACTCCAGTGG CGCGGCCTGC TCGCGCAGAC GACCGACCTT 
GACGCACTGC GCAAGGCGCT CGCCGATGGT CCGATCACCC TGTATTGCGG ATTCGACCCG 
ACGGCGGGCA GCCTGCACGT GGGCCACCTC ACCCAGATCC TGACCCTGGC CCGTTTCCAG 
CAGGCAGGCC ACCGCCCGAT CGCGCTGGTC GGCGGCGGTA CCGGTCTCAT CGGCGACCCC 
AAGCCCAACG CCGAGCGCCA GCTCAACTCG CTGGAGACCG TGCGGGGCTG GGTCGACAAC 
CTGGGCGGGC AGCTGTCCGC GTTCCTGCGC TTCACCCCCG AGGGGGAGCA GCCGGAGCCC 
ACCGACGCCG TCCTGGCCAA CAACGCCGAC TGGCTCGGCG AGATCAACGC CATCGAGCTG 
CTGCGCGACG TCGGCAAGCA CTTCAGCGTC AACCAGATGC TCGCCCGGGA GACGGTGAGG 
AGCCGGCTCG ACGGTGAGGG CATGAGCTAC ACCGAGTTCA GCTACGTGCT CCTGCAGTCC 
TACGACTACG TCCAGCTCTA CCGCCGCTTC GGCTGCACGC TGCAGACCGG CGGCTCCGAC 
CAGTGGGGCA ACATCACCGC GGGCCTGGAC CTGGTCCGCA GGATGGACGG AAACGAGCCG 
CACGGCCAGG CGCACGGGCT GACCACGAAC CTGCTCACCA AGGCCGACGG CACCAAGTTC 
GGCAAGACGG AGTCCGGCAG CGTCTGGCTC GACCCCGAGC TGACCTCGCC GTACGCCTTC 
TACCAGTTCT GGTTCAACGC CGACGACCGA GACGTGGTCC GCTACCTGAA GACCTTCAGC 
TTCCGCGACC GCGACGAGAT CGAGGAACTG GAGCGCCAGA CCGAGGAGCG TCCGCAGGCC 
CGCGCCGCCC AGCGCGTCCT GGCCGAGGAC CTCACCGTCC TCGTGCACGG CGAGGAGGAG 
TGCCGCAAGG TCAAGGAGGC CAGCCTGGCC CTGTTCGGCC GCGCGGACCT GTCCGACCTG 
GACGCCCGCA CGCTGGAGGC CGCCCTGGCC GAGGTTCCCC GGGCCGAGGT CGACGGTCCC 
GTCGACGGGC TGCTGGTGAC CGACGCGTTC GCGCGGAGCG GCCTGACGCC GAGCAAGTCC 
GCGGCCCGCC GCGCCATCCA GGAGGGCGGG GCCTACGTGA ACAACGTCAA GGTCACCGAC 
GTGGAGGCCG TGCTCCGCCC CGAGGACGTG CTCCAGGGAC GCTTCGTCGT GCTGCGCAAG 
GGCAAACGCA ACATCGGCGG CTTGGTCCTC AACGGCTGA

Protein sequence

MTDIIDELQW RGLLAQTTDL DALRKALADG PITLYCGFDP TAGSLHVGHL TQILTLARFQ 
QAGHRPIALV GGGTGLIGDP KPNAERQLNS LETVRGWVDN LGGQLSAFLR FTPEGEQPEP 
TDAVLANNAD WLGEINAIEL LRDVGKHFSV NQMLARETVR SRLDGEGMSY TEFSYVLLQS 
YDYVQLYRRF GCTLQTGGSD QWGNITAGLD LVRRMDGNEP HGQAHGLTTN LLTKADGTKF 
GKTESGSVWL DPELTSPYAF YQFWFNADDR DVVRYLKTFS FRDRDEIEEL ERQTEERPQA 
RAAQRVLAED LTVLVHGEEE CRKVKEASLA LFGRADLSDL DARTLEAALA EVPRAEVDGP 
VDGLLVTDAF ARSGLTPSKS AARRAIQEGG AYVNNVKVTD VEAVLRPEDV LQGRFVVLRK 
GKRNIGGLVL NG