Gene Elen_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1989
Symbol
ID	8416300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2333068
End bp	2334045
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	71%
IMG OID	645024966
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_003182342
Protein GI	257791736
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID	[TIGR03151] putative enoyl-(acyl-carrier-protein) reductase II

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.563999
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGA AGACGCGGGT AACGGAACTG CTGGGCATCG AGGTGCCCGT CGTGCAGGGC 
GCGATGGCGC GCATCGCGGA TGCGAGCCTG GCCGGCGCGG TGAGCGAGGC CGGCGGCCTC 
GGCATCATCG CATGCGGCGG CGCGCCGCTC GACTGGGTCG AGGAGCAGGT GCGCATCGCC 
CGCTCGATTA CCGACAAGCC CATCGGCGCG AACGTCATGC TCATGGATCC GAACGCGGGC 
GAGACGGCCG AGCTTCTGGC GAAGCTGCGT GTTGACGTCA TCACGACGGG CGCGGGTTCT 
CCCGCGAACT ACATGCAGCT GTGGAAGGAC GCCGGCATCA AGGTGGTGCC CGTGGTGGCC 
TCCAGCGCGC TGGCCGCGCG CATGGAGCGC CTCGGAGCCG ACGCCGTGGT GGCCGAGGGC 
ACCGAGGCCG GCGGCCATAT CGGCGAGCTG ACCACGATGG CGCTCATCCC CGCAGTATGC 
GACGCCGTGT CCATCCCCGT GATCGCCGCA GGCGGCATCG CCGACGGGCG CGGCATGGCC 
GCCGCCTTCG CGCTGGGCGC CGAGGGCGTG CAGGCGGGCA CCCGCTTCCT CACGGTGGAC 
GAGTGCACCA TCGCCGACGC GTACAAAGAG CGCGTGATCG CCGCCAAGGA CGCCGACACC 
ATCGTCACAG GCCGCGGCAG CGGGCATCCC GTGCGCTGCC TCAAGAACAA GTTCGCCCGT 
ACCGTGCGCA AGCTCGAAGG CGACGTCGCC GCCAACGGCG ACGAGCTGGA GGCTATGTAC 
GTGGGTTCCC TGCGCCGCGC CGTGGAGGGC GACGTGGACA ACGGCACCAT GATGGCGGGC 
CAGTCGGCCG CGCTCGTGCA CGAGCGCGCC ACGGCGGCCG AGGCTATCGC TCGGATGATC 
GAAGAAGCCG AGGCTCTGGG CGGTCTCGAC TTGGAAGCAC TGGCTGCGCT GAGCGCCCGG 
CGCGGGCGTG CGATCTAG

Protein sequence

MSMKTRVTEL LGIEVPVVQG AMARIADASL AGAVSEAGGL GIIACGGAPL DWVEEQVRIA 
RSITDKPIGA NVMLMDPNAG ETAELLAKLR VDVITTGAGS PANYMQLWKD AGIKVVPVVA 
SSALAARMER LGADAVVAEG TEAGGHIGEL TTMALIPAVC DAVSIPVIAA GGIADGRGMA 
AAFALGAEGV QAGTRFLTVD ECTIADAYKE RVIAAKDADT IVTGRGSGHP VRCLKNKFAR 
TVRKLEGDVA ANGDELEAMY VGSLRRAVEG DVDNGTMMAG QSAALVHERA TAAEAIARMI 
EEAEALGGLD LEALAALSAR RGRAI