Gene Elen_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0233
Symbol
ID	8414517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	320527
End bp	321885
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	70%
IMG OID	645023211
Product	amidohydrolase
Protein accession	YP_003180614
Protein GI	257790008
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACTG ATTCTTGCAT CATCCGCGGC GGCACGGTGG TGTGCGCCGA CCGCGTGCTT 
CCCGACTGCG ACGTCGTGGT CATCGACGGG CGCATCGCCG CCATCGAGCC GGTGGGCGCG 
TCCGACTTCG ACGCGCAGCC CGATGCCACG ATGGGCGTGC TGCCCGTGGT GGACGCGCGC 
GGCGCGTACG TGGCGCCCGG CCTCATCGAC ATCCACTCGG ACTACGTGGA GAACGTGGCC 
TCGCCGCGCC CCAGCGTGGT CATGGACCTG TCCACGTCGC TGTACAAGGC CGACCGCGAG 
CTGGTGTCGC ACGGCGTGAC CACCATCTTC CACTCGCTGT CGGTGTACGG CGCGCACGTG 
TTCGACCACA AGCCCATCCG CGATTTCGGC AACGTGAGCG CCCTCATCGA CCGCGTGGCC 
GCCCTGCGCG CGGGCGAGGA GCGCGACCAC CTCATCCGCC ACCGCCTGCA CATGCGCGTG 
GAGCTGGACT CGGTGGATTT GTACGACGAC ATCGAGAGCT TCCTGCGCTC GGGCAAGGTG 
GACCTCGTGT CGTTCATGGA CCACACGCCG GGGCAGGGCC AGTACCGCGA CCTGCTGGTG 
TTCGGCGACA CGCTGAAGGG CTACCGCGAC GTCAGCGACG AGGACGTGCG CGACATCGTG 
CGTCAGCAGC AGGAGAGCCA GAAGCTCACG TACGCCCAGA TCACAGCACT GGCGGCCGTG 
GCGCGCGAGC GCGGCGTGTC CATCGCCTCG CACGACGACG ACAGCGAGGA CAAGCTGGCG 
TTCATGGACG GCCTCGAGGC CACTATCTCC GAGTTCCCCA TCTCGCTGGA CATCGCGCGG 
GCGGCGCGGG CGCGCGGCAT GCACACCATC GCAGGCGCGC CGAACGTGAT GTTGGGCCAC 
AGCCACTCGG GCAACCTCAG CGCGCGCGAG GCCGTGCAGG CCGGCGCCAT CGACGTGCTG 
TGCAGCGACT ACTACCCGGC GGCGCTGCTG GACGCGGTGT TCACGCTGCG CGATCAGTGC 
GGGCTCGACA TCGCGAAAGC GTTCGCGCTG GTCACTATCA ACCCGGCGAA GGCCGCGGGC 
ATCGCCGACG AGGTGGGCTC CATCGCGGTG GGCAAGCGCG CCGACGTGCT GCTGGTGCGC 
GAGATCTCCT GCGGCGAAGG CGAAGGCTCG GGCGAGCACC CGGGCGCAAG GCCGGACGGT 
CGCGTCGCGC GCACGATGCC CGTGGTCACG CGCGCGTTCG TGGGCGGCCG CTCGGTGTTC 
CGCTCGCACT ATCCCGACCA GCCGCTCGGC TACGGGCGCG ACACCGAGCA GCTCGTCTCG 
CTCGACCAGC TGACCCGCCC TCTGGCCAAG GCGGTGTAG

Protein sequence

MDTDSCIIRG GTVVCADRVL PDCDVVVIDG RIAAIEPVGA SDFDAQPDAT MGVLPVVDAR 
GAYVAPGLID IHSDYVENVA SPRPSVVMDL STSLYKADRE LVSHGVTTIF HSLSVYGAHV 
FDHKPIRDFG NVSALIDRVA ALRAGEERDH LIRHRLHMRV ELDSVDLYDD IESFLRSGKV 
DLVSFMDHTP GQGQYRDLLV FGDTLKGYRD VSDEDVRDIV RQQQESQKLT YAQITALAAV 
ARERGVSIAS HDDDSEDKLA FMDGLEATIS EFPISLDIAR AARARGMHTI AGAPNVMLGH 
SHSGNLSARE AVQAGAIDVL CSDYYPAALL DAVFTLRDQC GLDIAKAFAL VTINPAKAAG 
IADEVGSIAV GKRADVLLVR EISCGEGEGS GEHPGARPDG RVARTMPVVT RAFVGGRSVF 
RSHYPDQPLG YGRDTEQLVS LDQLTRPLAK AV