Gene Ndas_0107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0107
Symbol
ID	9243938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	136693
End bp	138081
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	70%
IMG OID
Product	fumarate lyase
Protein accession	YP_003678064
Protein GI	297559090
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGT TCCGTATCGA GCACGACTCG ATGGGTGAGG TCAGGGTTCC GGCCGAGGCC 
AAGTGGAGGG CCCAGACGCA GCGTGCCGTC GAGAACTTCC CGATCTCCGG CCAGGGCCTG 
GAGGGCGCGC ACATCGCCGC CCTCGGCCAG ATCAAGGCCG CCGCGGCCAA GGTCAACGCC 
GAGCTCGGCG TCATCAGCGA CGACCTGGGC AAGGCGATCC GGGAGGCCGC CCTGGAGGTC 
GCCGAGGGCA GGTGGAACGA CGAGTTCCCG ATCGACGTCT TCCAGACCGG CTCGGGCACC 
TCCAGCAACA TGAACACCAA CGAGGTCGTG GCGACGCTGG CCACCGAGCG CCTCGGGGCC 
CCGGTGCACC CCAACGACCA CGTCAACGCG TCGCAGTCCT CCAACGACGT GTTCCCCTCC 
TCCATCCACA TCGCCGCCAC CTCCGCCGTG CAGAACGACC TGGTCCCGGC GCTGCGGCAC 
CTGGAGGAGG CGCTCGGCGC CAAGGCGACC GAGTTCGCCT CCGTGGTCAA GAGCGGCCGC 
ACCCACCTCA TGGACGCCAC CCCGGTCACC CTGGGCCAGG AGTTCGCCGG GTACGCCGCC 
CAGGTGCGCT ACGGCGTGGA GCGCCTGGAG GCCGTCCTGC CGCGCGTGGC CGAGCTGCCG 
CTGGGCGGCA CCGCCGTGGG CACCGGCATC AACACCCCCG AGGGCTTCTC CGCCCGGGTC 
ATCGCCGAGA TCGCCGAGCA CACCGGCCTG CCGCTGACCG AGGCCCGCGA CCACTTCGAG 
GCGCAGGGCG CCCGCGACGG CCTGGTCGAG CTGTCCGGCC AGCTGCGGAC CATCGCGGTC 
GGCTTCGCCA AGATCGCCAA CGACATCCGC TGGATGGGCT CGGGCCCGAC CACGGGCCTG 
GGCGAGATCC TCCTGCCCGA CCTCCAGCCC GGCTCCTCGA TCATGCCGGG CAAGGTCAAC 
CCGGTCCTGT GCGAGGCCGT GCTCCAGGTG ACCTCGCAGG TCGTCGGCAA CGACGCCGCG 
GTGGCCTTCG GCGGCGCGAG CGGCAACTTC GAGCTGAACG TGCAGCTGCC GATGATCGCC 
CGCAACGTGC TGGAGTCGAT CCGCCTGCTC TCCAACGTCT CGCGCGTGTT CGCGGACCGC 
TGCGTGTCCG GTATCGAGGC CAACGTCGAG CAGTGCCGCG TCTACGCCGA GTCCTCGCCG 
TCGATCGTGA CCCCGCTCAA CCGCTACATC GGCTACGAGG AGGCCTCCAA GGTCGCCAAG 
CAGTCGCTGA AGGAGAAGAA GACCATCCGC GAGGTGGTCA TCGAGCGCGG ATACGTCGAG 
GACGGCAAGC TCACCGAGGC GCAGCTGGAC GAGGCCCTCG ACGTGCTGCG GATGACCAAC 
TCCCAGTAG

Protein sequence

MSEFRIEHDS MGEVRVPAEA KWRAQTQRAV ENFPISGQGL EGAHIAALGQ IKAAAAKVNA 
ELGVISDDLG KAIREAALEV AEGRWNDEFP IDVFQTGSGT SSNMNTNEVV ATLATERLGA 
PVHPNDHVNA SQSSNDVFPS SIHIAATSAV QNDLVPALRH LEEALGAKAT EFASVVKSGR 
THLMDATPVT LGQEFAGYAA QVRYGVERLE AVLPRVAELP LGGTAVGTGI NTPEGFSARV 
IAEIAEHTGL PLTEARDHFE AQGARDGLVE LSGQLRTIAV GFAKIANDIR WMGSGPTTGL 
GEILLPDLQP GSSIMPGKVN PVLCEAVLQV TSQVVGNDAA VAFGGASGNF ELNVQLPMIA 
RNVLESIRLL SNVSRVFADR CVSGIEANVE QCRVYAESSP SIVTPLNRYI GYEEASKVAK 
QSLKEKKTIR EVVIERGYVE DGKLTEAQLD EALDVLRMTN SQ