Gene Ndas_2997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2997
Symbol
ID	9246850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3580821
End bp	3582026
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	77%
IMG OID
Product	imidazolonepropionase
Protein accession	YP_003680913
Protein GI	297561939
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.518074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG TGCCCCGCAG CATCGTCATC GACGACATCG CCACCCTGGT CACCAACGAC 
CCCTCCCGGG GACGGGGCGC GGTGGGCGAG GTCCGGGACG CGGCGCTGGT CGTCGAGGAC 
GGCCGGGTGG CCTGGTCGGG CCCGCGCGCC CAGGCGCCCG CCGCCGACGC GCGGATCGAC 
GCCGCCGGGC GCTGCGTCAT CCCCGGGTTC GTCGACAGCC ACTCACACAT CGTCTTCGCG 
GGCGACCGCA GCCGCGAGTT CGCCGCCCGG ATGAGCGGCC AGCCCTACTC GGCGGGCGGC 
ATCCGCACCA CCGTGGCCGC CACCCGCGAG GCCTCCGACG CCGACCTGCT CGCGGGGGCC 
CGGCGCCTGC TCCGCGAGGC CCGCGCCCAG GGCACCACCA CCCTGGAGGT CAAGTCCGGC 
TACGGGCTCA CCGTCGCCGA CGAGGAGCGC TGCCTGGCCG TGGCCGCCCG CGTCACCGAC 
GAGGTCACCT TCCTGGGCGC GCACGTGGTC GCGCCCGAGT ACGCCGACGA CCCCCAGGGC 
TACGTCGATC TGGTCACGGG GCCCATGCTG GAGGCCTGCG CGCCGCACGC CCGGTGGATC 
GACGTCTTCT GCGAGCGCGG CGCCTTCGAC GAGGACGCCT CCCGCCGGGT CCTGACCGCC 
GGGACGGAGC GCGGACTGCT GCCCCGCGTG CACGGCAACC AGTTGGGCCC GGGGCCGGGC 
GTGCGCCTGG CGGTCGAACT GGGCGCCGCC TCGGTCGACC ACTGCACCCA CCTGGAACCC 
GCGGACGTGG ACGCCCTGGC CCAGGCGGCC GCGCGCCCCG AGCCCACGGT CGCCACCCTG 
CTGCCCGGGG TGGACTTCTC CACCCGCCAG CCCTACCCGG ACGCCCGCGC GCTCATCGAC 
GCCGGGGCCC TGGTCGCCCT GGCCAGCGAC TGCAACCCGG GTTCGTGCTT CACCTCCAGC 
CTGGCCTTCT GCGTCGCGGT CGCCGTCCGC GACACGGGCA TGACCCCCGA CGAGGCGGTG 
TGGGCGGCCA CCGCGGGAGG GGCGCGGGCG CTGCGCCGCA CCGACGTCGG CCACCTGGCC 
CCCGGCGCGC GCGCCGACCT GGTCCTGCTG GACGCGCCCA ACCACCTCTA CCTCGCCTAC 
CGGCCGGGGG TCCCCCAGGT CGCGGCGGTC TGGAAGGACG GGGAGCTGGT CTCGGGGCGC 
CCCTGA

Protein sequence

MSDVPRSIVI DDIATLVTND PSRGRGAVGE VRDAALVVED GRVAWSGPRA QAPAADARID 
AAGRCVIPGF VDSHSHIVFA GDRSREFAAR MSGQPYSAGG IRTTVAATRE ASDADLLAGA 
RRLLREARAQ GTTTLEVKSG YGLTVADEER CLAVAARVTD EVTFLGAHVV APEYADDPQG 
YVDLVTGPML EACAPHARWI DVFCERGAFD EDASRRVLTA GTERGLLPRV HGNQLGPGPG 
VRLAVELGAA SVDHCTHLEP ADVDALAQAA ARPEPTVATL LPGVDFSTRQ PYPDARALID 
AGALVALASD CNPGSCFTSS LAFCVAVAVR DTGMTPDEAV WAATAGGARA LRRTDVGHLA 
PGARADLVLL DAPNHLYLAY RPGVPQVAAV WKDGELVSGR P