Gene Namu_1781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1781
Symbol
ID	8447384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1956442
End bp	1957497
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	645040908
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_003201160
Protein GI	258652004
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.000215592
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.125783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCG TCCTCACCCC CACCGACGTC CACCGCGCAC CCGAACCGCT TGAGCAACGA 
ATCCGCCGTC ACCCGCACAC GTTTCGCGTG CTCTCGGGCG ATCGACCCAC CGGTGCGCTG 
CATCTGGGCC ACTATCTGGG CACTTTGCGC AACCGGGTCC AGCTGCAGAA CCTCGGCGTG 
CCCGTCGTCG TCGTCATCGC CGACTATCAG GTCATCACGG ACCGCTCGGA TCTCGGGCCG 
GTCCGCGACC GGGTGCGCAC CCTGGTCGCC GAATACCTGG CCGCCGGGCT CGATCCGGCC 
CGCAGCGTGA TCTTTCCGCA CTCCGCGGTC GCGGCCCTGA ACCAGCTGAT GCTGCCATTT 
CTGTCGCTGG TCACCGACGC CGAACTGCGC CGCAACCCCA CCGTCAAGGC CGAGGCACTG 
GCATCCCGGC GGCCGTTGGG CGGGCTGCTG CTGACCTACC CGGTGCATCA GGCGGCCGAC 
ATCCTGGGGG TGGGCGGCAC GGTCGTGCCG GTGGGGCGTG ACCAGCTCCC GCACCTGGAG 
CTGACCCGGG TCATCGCCCG GCGGTTCAAC GAGCGCTACG GGCCGGTGTT CGCCCTGCCC 
GAGCCGTTGC TGAGCGGCAC GCCGAACCTG CTGGGTACCG ACGGCGCGAA GATGTCCAAG 
ACCCGCGGCA ACACGATCGC CCTGGGTGAC ACCGCGGACC GGACCGCAGC GATCGTCCGG 
GCCGCGCAGA CCGACTCGAC CCGCCGGATC ACCTTCGAAC CGACCAGTCG ACCCCAGGTT 
GCCAACCTGC TGGCGATCAT CGGCGAGATC ACCGGTCGCG ACCCGGCAGC GGTCGCCGAC 
GAGATCGGGG ACGGGGGAGC GGCCGAGCTC AAACGGCAGG CCATCGAGAC CATCAACGAG 
GAGCTGGCAC CGCTGCGGCG CCGCCGCGCC GAGCTGCTCG CCGATCCGGT CCAGTTGGAC 
GGGGTGCTGC TCGACGGCAT CGCGGCGGCG ACCGCCGTGG CCGGGGACAC CCTGGCTCGG 
GTGCGCAGTG CGATGGGGAT GGACTACCTG CGATGA

Protein sequence

MTAVLTPTDV HRAPEPLEQR IRRHPHTFRV LSGDRPTGAL HLGHYLGTLR NRVQLQNLGV 
PVVVVIADYQ VITDRSDLGP VRDRVRTLVA EYLAAGLDPA RSVIFPHSAV AALNQLMLPF 
LSLVTDAELR RNPTVKAEAL ASRRPLGGLL LTYPVHQAAD ILGVGGTVVP VGRDQLPHLE 
LTRVIARRFN ERYGPVFALP EPLLSGTPNL LGTDGAKMSK TRGNTIALGD TADRTAAIVR 
AAQTDSTRRI TFEPTSRPQV ANLLAIIGEI TGRDPAAVAD EIGDGGAAEL KRQAIETINE 
ELAPLRRRRA ELLADPVQLD GVLLDGIAAA TAVAGDTLAR VRSAMGMDYL R