Gene Ndas_0685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0685
Symbol
ID	9244527
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	841443
End bp	842651
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	72%
IMG OID
Product	imidazolonepropionase
Protein accession	YP_003678636
Protein GI	297559662
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.298595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.285434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGG TACTCCTCAG CAACATCGGT CGGCTGTGGA CCGGGAGCGA GCTGATCACC 
AAGGCCGCGC TCCTGATGGA CGACGACCGG GTGGCCTGGG TCGGGCCCGC CGCCGAGCTC 
CCCCAGAGCA TTCCGGGCGT GGTGGACGAC CTCACCGACG TCGACGACGT CGTCAACATC 
GGCGGCGGCA TGATCACCCC GGGGCTGATC GACGCCCACT GCCACCCGGT GTACGCGGGG 
GACCGCTACG CCGAGGTCAA CATGTGGGCC AAGGGCGCCT CCAAGGGGGA CATCTTCGCG 
GCCGGGGGCG GTGTCTCCAC CACCGTCACC ATCACCCGGG GTACCGATCC CTGGACCCTG 
TGCAACGCGG TCCGCGAACG GCTCCGGCAC TGGGTGCTGA CCGGCACCAC CACCGTGGAG 
GCCAAGACCG GCTACCACCT GACCAGGGAC GGCGAACTGG CCGACGTGCG CCTGCTGCGC 
TCCCTGGAGG AGGAGCCGGG CATGCCGCGC CTGCACGTCA CCTTCTTCCC CGCGCACGGG 
GTGCCGCCCG AGTTCTTCGG CAGACCCAGG GAGTACGCGG CCACCGCCGC CTCCTGGCTC 
AGCGACGCCG CGCTGGCCGG TGCCGACGGG GTGGACGTGT ACTGCGACAA CCAGCAGTTC 
ACCACCGAGG ACGCCCGCAT GCTGCTGGGG GTGGGCCAGT CCGCGGGGCT GCGCACCACC 
CTGCACGCCT GCTCGCGCCC CCGGCACGGC GCCGTGCGCA TGGCCGCCGA GATCGGCTGC 
TCCTCGGTGG ACCTGCTGCA CGAGACCGAC GAGCAGGACG TCCTGGCGCT GGCCGCCACC 
CGCACACCGG TGGTGGCCTG CCCGACGACC TCGCTGCACG AGCGCCGCAC CCCGCCGGTG 
CGGGCGCTGC TCGACCACGG CGTGCCCATC GGGCTGGGCA CCGACCACAA CCCCGGCCAG 
TCGGGCACGA TGTCGATGCC GCTGGTGATC TCGCTGGCCA TCTCCATGTT CGAGATGACC 
GTGCAGGAGG CCCTGTACGC CGCCACGGTG GGCAGCGCAC GCGCCCTGGG CCTGACCGAC 
CGGGGCGTGC TCGCGCCCGG GAGCCTGGCC GACCTCGTCC AGTGGGACGC CGACCACGAG 
GGCGCCTTCG CCTGGTCGAT GGGCCTCAAC ACCCTGCGGG TGTGGCAGGG CGGCAGGACC 
ATCCGCTGA

Protein sequence

MTAVLLSNIG RLWTGSELIT KAALLMDDDR VAWVGPAAEL PQSIPGVVDD LTDVDDVVNI 
GGGMITPGLI DAHCHPVYAG DRYAEVNMWA KGASKGDIFA AGGGVSTTVT ITRGTDPWTL 
CNAVRERLRH WVLTGTTTVE AKTGYHLTRD GELADVRLLR SLEEEPGMPR LHVTFFPAHG 
VPPEFFGRPR EYAATAASWL SDAALAGADG VDVYCDNQQF TTEDARMLLG VGQSAGLRTT 
LHACSRPRHG AVRMAAEIGC SSVDLLHETD EQDVLALAAT RTPVVACPTT SLHERRTPPV 
RALLDHGVPI GLGTDHNPGQ SGTMSMPLVI SLAISMFEMT VQEALYAATV GSARALGLTD 
RGVLAPGSLA DLVQWDADHE GAFAWSMGLN TLRVWQGGRT IR