Gene Ndas_2068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2068
Symbol
ID	9245918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2488359
End bp	2489549
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	73%
IMG OID
Product	acyltransferase 3
Protein accession	YP_003680000
Protein GI	297561026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.300779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGC ACGCCAGCCC ACCCCTCCTC CCGGACCCCG CGCCGCCCGC GCGCGGGCGC 
CTGCACCACG TCGACAACCT GCGGGTCGCG CTGACCGTGC TGGTCGTCCT GCACCACGTC 
GCGCTCACCT ACGGCAACAT CCCGGTGTGG TTCTACCTCG AACCGGCCCA GGACCCCTCC 
GGCGGCCTTC TGGACCTGTT CGTCTTCCTC AACCAGACCT ACTTCATGGG ACTGTTCTTC 
CTGCTCGCGG GCTACTTCGT GCCCGGAGCG GCCGACCGCC GGGGCGGGCG CGGGCTGGTC 
CGCGAGCGCC TGGTGCGCCT GGGGGCGCCC TTCCTGCTGT TCGTGCTGCT GGTCCGCCCG 
TTCCTGATGA TCCCCAACTA CGGGCCCGCC GTCGAGATGT TCGCGGCCGA GGGCGGCGAG 
CTGCCGTTCT GGCTGTTCCT GATCGTGACC TACGACCCCG GGCCCATGTG GTTCGTGGAG 
GTCCTGCTGG TCATGACCCT GGCCTACGTG GCCGTGCGGA GCCTGCGCGA GCGCCGCGCC 
CGGCAGACGG GCGCGGCGGT CGAGCCCCCC GCGCGGCCCG CCGACACCGC TCCGCTGCGC 
TGGGCCGTGC CCGTCGCGGC CCTCACCCTG GGCCTGGCAC TGGTCACCTT CGCCTGGCGC 
TACCTGGCCC CGGCCCCGTA CTGGCCGATC GTGGGGCTGC CCAGCCCCGG CTTCCTGCCC 
CAGTACGTCA CCCTGTTCGT CCTGGGCGTG CTGGCCTACC GGGGCAACTG GCTGGTCCGG 
CTGCCCGGCG CCGCCGGGTG GTGGGGCGCG GCCCTGGCCC TGACGGGTCT GGCGGCGGGA 
GCGGCGGTCA CGGTCCTGCT GGGCGAGATC ACGCCCGCGT CGGGCACCTG GCAGGCGCTG 
GCGCAGATCA CCTCCGAGTC CGTCCTGGCC ACGGGCGCGA TGCTCATGCT GCTGGTGGGT 
TTCCGGCGCT TCGCCAGCGG GAGCAACCGC CTCACGCGCT GGCTGTCCGA CAACGCCTTC 
GCCGTGTACG TCCTGCACCC GCTGGTGCTG GTAGGGCTGG GTGTGGCCCT GAGCGGTTGG 
GAGGCCAGCG CGCTCGTGAA GTTCCTCGGC ATGGGAGCGC TCGCGGTCCC GGCCTGCTGG 
GCGCTGGCCA CCGCCGTGCG GTCGGTTCCC GGAGCGCGTC GGATCCTGTG A

Protein sequence

MTQHASPPLL PDPAPPARGR LHHVDNLRVA LTVLVVLHHV ALTYGNIPVW FYLEPAQDPS 
GGLLDLFVFL NQTYFMGLFF LLAGYFVPGA ADRRGGRGLV RERLVRLGAP FLLFVLLVRP 
FLMIPNYGPA VEMFAAEGGE LPFWLFLIVT YDPGPMWFVE VLLVMTLAYV AVRSLRERRA 
RQTGAAVEPP ARPADTAPLR WAVPVAALTL GLALVTFAWR YLAPAPYWPI VGLPSPGFLP 
QYVTLFVLGV LAYRGNWLVR LPGAAGWWGA ALALTGLAAG AAVTVLLGEI TPASGTWQAL 
AQITSESVLA TGAMLMLLVG FRRFASGSNR LTRWLSDNAF AVYVLHPLVL VGLGVALSGW 
EASALVKFLG MGALAVPACW ALATAVRSVP GARRIL