Gene Ndas_4272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4272
Symbol
ID	9248146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5085976
End bp	5087187
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	76%
IMG OID
Product	Beta-ketoacyl synthase
Protein accession	YP_003682167
Protein GI	297563193
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.278476
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGG TCATCACCGG ACTCGGCACG GTCTCACCCG CCGGGGTGGG CGTCCCGGAG 
TACTGGGAGG CGGTCCGGGA GGGGCGATCG CTCCTCGCGC CGATCCCCGA CTTCGACACC 
GACGGCTTCC ACGTGCGCGT GGGCGGGAAG ATCCCCGGCT TCGACCCGCA CGACCACCTC 
GACGGCCGCT ACGTCGTCCA GACCGACGCC TTCAGCTGGT TCGCGATGGT CGCGGCCGGC 
GAGGCCCTGC GCGACTCGGG GCTGGACCCC GCCGCCGACC CCTACGCGGT CGGCGTGCTG 
ATCTGCAGCT GCACGGGCGG CGTGGAGTTC GGCCAGCGCG AGATCGAGGC CCTGTGGAGC 
AGGGGCCCCG ACCACGTCGG CCCCTACCAG TCCATCGCCT GGTTCTACGC GGCGAGCACC 
GGACAGATCT CCATCAGCAA CGGCCTCAAG GGCATGTGCG GGGTGCTGGT CACCGACGAG 
CCGGGCATGC TCGACGCCCT GGGCCAGAGC GAACGGGCCC TGCGGCGCGG GACCTCCGCG 
ATGCTGGTCG GCGGAAGCGA GGCCCCGATC GGCTCCCCGT TCGCACTGGC CTGCCACGCG 
GGCGCCGAGG TCCTCAGCCG CGGCGAGGAC CCCCGCACGG CCTACCTCCC CTTCACCGAG 
GGGGCGGCCG GCCACGTCCC GGCCGAGGGC GCGGCCGTCG CCGTGGTGGA GGACGAGGCC 
GCCGCGCGGG CGCGCGGCGC CAGGATCCGG GCCCGGGTCG CGGGGCACGC GAGCACCTTC 
GGCGGGGTCG GATCGTTCGA CCCGGGCGGT GCCGGACTCC TGCACGCGGC CCGGGAGGCG 
ATGCGCCGGG CCGCCGTCGC CCCCGAGGAC GTGGACGTGG TCTTCGCCGA CGCGGTGGGC 
ACGCCCAAGG CCGACGCCGA CGAGGCCGCC GTGCTGCGCG AGCTGTTCCC CGGCGGGGTG 
GCCGTCACCG CGCCCAAGAC CGGCTTCGGA CGCGCCTACG CCGGGTCGGG CGCGCTGGAC 
GTGGCCGCCG CCGTCCTGAG CCTGGAACAC CAGGTCGTAC CGCCCACACC CAACGTCCCC 
GACGCGCCCA GCGGACTGGA CCTGGTCGTG CGGGTGCCGC GCGCCGCGCG CCTGCGCACC 
GCGCTGGTCC TGTCGCGCGG CCTGGGCGGC GGCAACTCCG CCGTCGTCCT GACCCGCCCC 
GACCCGGTCT GA

Protein sequence

MSTVITGLGT VSPAGVGVPE YWEAVREGRS LLAPIPDFDT DGFHVRVGGK IPGFDPHDHL 
DGRYVVQTDA FSWFAMVAAG EALRDSGLDP AADPYAVGVL ICSCTGGVEF GQREIEALWS 
RGPDHVGPYQ SIAWFYAAST GQISISNGLK GMCGVLVTDE PGMLDALGQS ERALRRGTSA 
MLVGGSEAPI GSPFALACHA GAEVLSRGED PRTAYLPFTE GAAGHVPAEG AAVAVVEDEA 
AARARGARIR ARVAGHASTF GGVGSFDPGG AGLLHAAREA MRRAAVAPED VDVVFADAVG 
TPKADADEAA VLRELFPGGV AVTAPKTGFG RAYAGSGALD VAAAVLSLEH QVVPPTPNVP 
DAPSGLDLVV RVPRAARLRT ALVLSRGLGG GNSAVVLTRP DPV