Gene Ndas_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1870
Symbol
ID	9245720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2283078
End bp	2284295
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	73%
IMG OID
Product	fumarylacetoacetase
Protein accession	YP_003679804
Protein GI	297560830
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.335153
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGACA GCTGGCTCGA CCTCGCCCCG GACACGCAGT TCGGCCTGGC CACCCTGCCC 
TACGGCGTGT TCGGCACCGC CGACGACCCC GCGCCCCGCA CGGGCGTGGC CGTCGGTGAC 
CACGTCCTGG ACCTGGGGGC CGCGGCCCGC GCTCTGGACG CGCCCTTCGC CGACACCGTC 
GACCGGCCCA GCCTGGACGC CCTGCTGGCC GCCGGACGGC CGGTGTGGGA CCAGGTGCGC 
GCCGCGCTCA CCGACTGGTT CACCGACCCC GCGCGCGCCG CGGCCGTGCG CCCGCACCTG 
GTGGACCGGG CGTCCGTACG CATGTATCTA CCCTTCACGG TCGCCGACTA CGTGGACTTC 
TACGCTTCCG AGCACCACGC CAGCAACGTC GGCCGCATGT TCCGCCCCGA CCAGGAGCCC 
CTCACCCCCA ACTGGAAGCA CCTGCCGATC GGCTACCACG GGCGTTCGGG CACCATCGTG 
GTCTCGGGGA CCGACATCGT GCGCCCCACC GGCCAGCGCA AGCCGCCGAC CGAGCCCGCG 
CCCGTCTTCG GGCCCTCGGT CCGCCTGGAC ATCGAGGCCG AGGTGGGCTT CGTCGTCGGG 
ACCGGAACCG AGATGGGCGA GCGCGTCGCG GTGGACGACT TCGCCGACCA CGTGTTCGGG 
GTGTTCCTGC TCAACGACTG GTCCTCCCGC GACCTCCAGG CCTGGGAGTA CGTGCCGCTG 
GGGCCGTTCC TGGGCAAGTC GTTCGCCACG TCGGTGTCGC CGTGGATCGT GCCGCTGGCC 
GCGCTGGAGT CCGCGCGCGT GGAGCAGCCC GCACAGGACC CCGAGCCGCT GCCCTACCTC 
CGGGGCGACG GCGGGCCCTG GGGCCTGGAC CTGCGCCTGG AGGTGCGGCT GAACGGGCAC 
CTGGTGTCCA CGCCGCCGTT CTCGCAGATG TACTGGACGG CGGCCCAGCA GCTCGCGCAC 
ATGACCGTCA ACGGGGCGTC CCTGCGCACC GGGGACGTGT ACGCCTCCGG CACGGTCAGC 
GGACCCGAGC GCGGGCAGCG GGGCTGCCTG CTGGAGCTGA CCTGGAGCGG GAAGGAGCCG 
CTGAGCCTGC CCGACGGTAC CGAGCGGACC TTCCTGGAGG ACGGCGACGA GGTGACTATT 
ACGGCTACGG CCCCGGGCCC GGACGGGACC ACCGTGCACT TCGGTGAGGT GACCGGCAGG 
ATTCTCCCCG CCCGCTGA

Protein sequence

MPDSWLDLAP DTQFGLATLP YGVFGTADDP APRTGVAVGD HVLDLGAAAR ALDAPFADTV 
DRPSLDALLA AGRPVWDQVR AALTDWFTDP ARAAAVRPHL VDRASVRMYL PFTVADYVDF 
YASEHHASNV GRMFRPDQEP LTPNWKHLPI GYHGRSGTIV VSGTDIVRPT GQRKPPTEPA 
PVFGPSVRLD IEAEVGFVVG TGTEMGERVA VDDFADHVFG VFLLNDWSSR DLQAWEYVPL 
GPFLGKSFAT SVSPWIVPLA ALESARVEQP AQDPEPLPYL RGDGGPWGLD LRLEVRLNGH 
LVSTPPFSQM YWTAAQQLAH MTVNGASLRT GDVYASGTVS GPERGQRGCL LELTWSGKEP 
LSLPDGTERT FLEDGDEVTI TATAPGPDGT TVHFGEVTGR ILPAR