Gene Ndas_3598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3598
Symbol
ID	9247467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4310862
End bp	4312610
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	72%
IMG OID
Product	prolyl-tRNA synthetase
Protein accession	YP_003681504
Protein GI	297562530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.393405
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTACTGC GGATGTCGAC CCTGTTCCTG CGCACCCTGC GTGAGGACCC GGCGGACGCC 
GAGGTGCCGA GCCACAAGCT GCTGGTCCGG GGCGGGTTCG TGCGCCGGGC CGCACCCGGC 
GTCTACACCT GGCTGCCCCT GGGCAAGATC GTCCTGGAGA ACGTCGCCCG GATCGTGCGC 
GAGGAGATGG ACGCCATCGG CGCCCAGGAG GTGCTCCTGC CCGCGCTGCT GCCCCGCGAG 
TACTACGAGG CCACCGGGCG CTGGGAGGAG TACGGCGACA CCCTGTTCCG CCTCAAGGAC 
CGCAAGGGCG CCGACTACCT GCTCGGCCCC ACCCACGAGG AGCTGTTCAC ACTCCTGGTC 
AAGGGGGAGT ACTCCTCCTA CAAGGACTTC CCGGTCACGC TGTACCAGAT CCAGGAGAAG 
TTCCGCGACG AGGCGCGTCC CCGCGCGGGC GTGCTGCGCG GCCGCGAGTT CCACATGAAG 
GACTCCTACT CCTTCGACAT CGACGACGAG GGCCTGCGCG CGTCCTACGC CGACCACCGC 
GCCGCCTACA TCCGCGTCTT CGACCGGCTG GGCCTGGAGT ACGTGATCGT GTCGGCCACG 
TCGGGCGCCA TGGGCGGATC GGCCTCGGAG GAGTTCCTGG CCGTCGCCCC GACCGGCGAG 
GACACCTTCG TGCGCAGCAC GGAGTCCGAC TACGCCGCCA ACGTCGAGGC CGTGGCCGTC 
CCGGCCCCCG AGGCGCTGCC GGTCGAGGGG CTGCCCGAGG CCGCGGTCCA CCACACCCCG 
GACACCGCCA CCATCCAGAC CCTGGTGGAC TTCCTCAACG GCGCCGGGCT GGGCCGCGAC 
TTCAGCGAGG CCGACACCCT CAAGAACGTC CTGGTCAAGA CCCGCGCGCC CGGTGCGAAG 
GAGTGGGAGC TGCTGGCCGT CGGCCTGCCC GGCGACCGTG AGGTGGACTT CAAGCGCCTG 
GAGGCGGCGC TGGAGCCCGC CGAGGTCGCC CTGCTGGAGG AGGCCGACTT CGCGGCCAAC 
CCCTTCCTGG TCAAGGGCTA CATCGGCCCC CGCGCGCTGC TGGACAACAA GGTCCGCTAC 
CTGGTCGACC CCCGGGTGGT CACCGGCACC TCCTGGGTGA CCGGTGCGGA CGAGGCCGAC 
CACCACGTCG TCGGACTGGT CGCGGGCCGC GACTTCGTCC CCGACGGCAC CATCGACGTC 
GCCGAGGTGC GCGACGGCGA CCCCTCGCCC GACGGCAGGG GGACCCTGTA CACCGCGCGC 
GGCATCGAGA TCGGCCACAT CTTCCAGCTG GGCCGCAAGT ACACCGACGC CTTCCAGGTG 
GACGCCCTGG GCCCCGACGG CAAGCCCCGG CGGATCACCA TGGGCTCCTA CGGCATCGGT 
GTCTCGCGCG CCGTCGCCGC GGTCGTCGAG CAGTCCCACG ACGACAAGGG CGTCGTCTGG 
CCGCGCGAGG TGGCGCCCGC CGACGTGCAC GTGGTCGGCA CCGGCAAGGG AGAGCAGATC 
GAGGAGGCGC TGCGGATCGC CCGGGAGCTG GAGGCCAGGG GCCTGCGCGT CCTCGTGGAC 
GACCGCAAGG GCGTCTCGCC CGGCGTCAAG TTCACCGACG CCGAACTCCT GGGCGTCCCC 
ACCGGCGTCA TCGTCGGCCG CGGCCTCAAG GACGGCCTGG TGGAGCTGCG CGACCGCGCC 
ACCGGCGACC GCGAGGAGGT CGCCCTGGCC GAGATCGTGG ACCGCGCCGT CGCCGCCTGC 
CGCGCGTAG

Protein sequence

MLLRMSTLFL RTLREDPADA EVPSHKLLVR GGFVRRAAPG VYTWLPLGKI VLENVARIVR 
EEMDAIGAQE VLLPALLPRE YYEATGRWEE YGDTLFRLKD RKGADYLLGP THEELFTLLV 
KGEYSSYKDF PVTLYQIQEK FRDEARPRAG VLRGREFHMK DSYSFDIDDE GLRASYADHR 
AAYIRVFDRL GLEYVIVSAT SGAMGGSASE EFLAVAPTGE DTFVRSTESD YAANVEAVAV 
PAPEALPVEG LPEAAVHHTP DTATIQTLVD FLNGAGLGRD FSEADTLKNV LVKTRAPGAK 
EWELLAVGLP GDREVDFKRL EAALEPAEVA LLEEADFAAN PFLVKGYIGP RALLDNKVRY 
LVDPRVVTGT SWVTGADEAD HHVVGLVAGR DFVPDGTIDV AEVRDGDPSP DGRGTLYTAR 
GIEIGHIFQL GRKYTDAFQV DALGPDGKPR RITMGSYGIG VSRAVAAVVE QSHDDKGVVW 
PREVAPADVH VVGTGKGEQI EEALRIAREL EARGLRVLVD DRKGVSPGVK FTDAELLGVP 
TGVIVGRGLK DGLVELRDRA TGDREEVALA EIVDRAVAAC RA