Gene Ndas_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2198
Symbol
ID	9246048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2628015
End bp	2629634
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	74%
IMG OID
Product	AMP-dependent synthetase and ligase
Protein accession	YP_003680126
Protein GI	297561152
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.861325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000258347
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCGTGC CCGACCCGGA GCACCACGTC CGCGACTGGC TCGCCACTTA CGACACACCC 
ACCACATCGG TGGCCCACCT CCTCTGCGAC CGCCACGACC CCCACGCCAC CGCCACCACC 
GAGATCGGCC CCACCCTGGA GGCCACCACC CTCACCTTCG GCGAACTCGC CCGGCGCTCC 
CGCGACCTGG CCACCGGTCT GGCCGACCTG GGCATCACCA GCGGGGACCG CGTCGCCACC 
CTCATCCCCA AGGGCGTGGA CCTGACCGTC ACCGCCCTGG CCGTGTGGCG TCTGGGCGCC 
GTCCTGGTCC CCCTGCTCTC CTCCTTCGCC CCCTCGGCCA TCAACGAGCG CCTCACCGAC 
TCCGGCGCCC GCCTGGTGGT GTGCGACGCC GAGTACCGCG CCAAGCTCGT CCCCGGCGCC 
GACCGCCCCT GGCACATCGC CACCACCGCC GCCGAGCCCG CCCACGAGGG CGACCACACC 
CTCACCGGCC TGGCCGCCCG CGCAGCCGCG GCGCCGTCCG TCCCCGACGC CGCCGTGGGC 
GGGGACGGCC CGCTGGCCGT CGTCTACGTC TCCGGGGTCA TCGGCCCGCC CCGGGGCGTG 
CGGGTGCCCG TGCGCGCCCT GGCCGCCATG CACGCCTACC ACCACTACGG CCTGGGCGTG 
CACGACGACG ACGTCTACTG GAACACCGCC GACCCCGGCG CGGCCTACGG CCTCTACCAC 
GGGCTCATCT CGCCGCTGCT GGCCGGGCAC AACTCCCTGG CGCTGCGGGC CGGGTTCTTC 
GACCCGGAGC TGACCCTGGA CGTGCTGGGC GTGCACGGCG TCACCAACCT GGCGGCCGAT 
CCCACCACCT ACCGCACGCT GCGCGCGGCC ACCAAGACCC TGCCGCCCGA GGTGATGGTG 
CAGAGCCTGG CCAGTGCGGG CGAGCCGCTG GCCCCCGACG TCATCGACTG GGTCACCGAC 
GTGTTCGGCG TCCCGGTGCG CGACCACTAC GGGCAGACCG AGCTGGGCTG GTGTGTGGGC 
GTGCCCAACG GCGACACCGG TCAGGGGCCG GCCGATCCGC CGCCGGGGGC GATCGGTCCC 
GCGCTGCCGG GCTGGCGGGT GCAGATCCTG GAGGCGATCT CCGACGACCC CGCTCCCCTG 
GGCGCCTACG GGCGTGTGGC GGTGGACCTG GAGCGCAGTC CGCTGGCCTG GTTCGAGGGC 
TACGTCGGTC AGGAGGGGGC CTCGCAGGTC AGGTTCACCC CCGACCGCGC CTACTACCTG 
ACCGGGGACA CCGGTATCCA GGACCGGCAG GGGTCGTTGT TCTTCTCCAC CCGTGACGAC 
GGCGCCATCT TGACCTACGG GTACCGGATC GGTCCGAGTG AGGTGGAGTC GGTGCTCAAC 
GCCCACCCGG CGGTGGAGGA GTGCGGGGTG TACTCGATCC CCGACGAGCT CGCCGGGCAG 
GTGATCGGTG CGCGGGTGGT TCTGGGCGCC GGTCACGAGG CCACTCCGGA GCTGGCCGAG 
GAGCTCAAGG GGTGGGTGGG CGAGCGGTTC GCCGCGCACG CCGCGCCGCG GGTGGTGGAC 
TTCGTGGAGG AGCTGCCTCG TACGGCCTCG GGCAAGATGC GCCGGGCGCG CCTGCGCTGA

Protein sequence

MPVPDPEHHV RDWLATYDTP TTSVAHLLCD RHDPHATATT EIGPTLEATT LTFGELARRS 
RDLATGLADL GITSGDRVAT LIPKGVDLTV TALAVWRLGA VLVPLLSSFA PSAINERLTD 
SGARLVVCDA EYRAKLVPGA DRPWHIATTA AEPAHEGDHT LTGLAARAAA APSVPDAAVG 
GDGPLAVVYV SGVIGPPRGV RVPVRALAAM HAYHHYGLGV HDDDVYWNTA DPGAAYGLYH 
GLISPLLAGH NSLALRAGFF DPELTLDVLG VHGVTNLAAD PTTYRTLRAA TKTLPPEVMV 
QSLASAGEPL APDVIDWVTD VFGVPVRDHY GQTELGWCVG VPNGDTGQGP ADPPPGAIGP 
ALPGWRVQIL EAISDDPAPL GAYGRVAVDL ERSPLAWFEG YVGQEGASQV RFTPDRAYYL 
TGDTGIQDRQ GSLFFSTRDD GAILTYGYRI GPSEVESVLN AHPAVEECGV YSIPDELAGQ 
VIGARVVLGA GHEATPELAE ELKGWVGERF AAHAAPRVVD FVEELPRTAS GKMRRARLR