Gene Elen_1617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1617
Symbol
ID	8415916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1915147
End bp	1916679
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	67%
IMG OID	645024586
Product	RNA binding metal dependent phosphohydrolase
Protein accession	YP_003181974
Protein GI	257791368
COG category	[R] General function prediction only
COG ID	[COG1418] Predicted HD superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR03319] conserved hypothetical protein YmdA/YtgF

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000205751
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00000000000531756
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCGAAT TCATCTGGCT GATCATCGGA GCCGTCGTCG GCATCGCCCT CGGCTTCGTC 
GTCACCCGCT ACCTGGTCAA CGCATCCACG AAGCGAGCGG CGCAAGAGGC CGAATCCGTG 
GTGAACGACG CGAAACGACA AGCCGAAACG CTGCGCCGCG AGGCCATCAT CGAAGCGAAG 
GACGAAGCTC TCAAGCTGAA GCAGGATGCG CAAGCCGAGA GCAAGGAGCG TCTGCGCGAA 
GTGCGTTCCG CTGAGAACCG CATCTCGCAG CGCGAGGAAT CGCTCGACCG CCGCGTCGAA 
TCGCTCGACG CGCGCGAGCA TCAGATCTCA TCCATGCAGG GCCAGCTCGA GCGTCGCGAA 
CGCGATCTCG AAGAGGCCAC GCGGGAGGTG AACTACCGCC TCGAGCGCGT GGCCGGCATG 
ACGCCGGACG AGGCGAAGGC GGAGCTGCTC GACACCCTCA AGGACGAGGT GACGCACGAG 
TCCGCGGCCA TCATCCGCGA TGCCGAGGCG CGCGCGAAGG CGGAGGCCGA CAAGAAGGCC 
CGCTCCATCC TCAGCCTCGC CATCCAGCGC GTGGCGGCCG ACCACTCGGC CGAAACCACC 
GTGTCCACCA TCCATATCCC CTCCGACGAC CTCAAGGGCC GCATCATCGG CCGCGAGGGC 
CGCAACATCC GCTCGTTCGA ACAGCTGACC GGAACGAACC TCATCATCGA CGACACCCCG 
GAGTGCGTGA CCATCTCGTG CTTCGATCCG GTCCGTCGCG AGATCGGCCG CGTTACGATG 
GAGAACCTCG TGGCCGACGG CCGCATCCAT CCGGCGCGCA TCGAGGAGAT GTTCGGCAAG 
GCCGAGGCGT TCGTGAACCA GCGCGTCCAG GAAGCGGGCG AGCAGGCCAC GTTCGACACC 
GGCATCCACG ATCTGCACCC CGAGCTCGTG CGCACGCTGG GCCGTCTGCG CTACCGCACC 
TCGTACGGCC AGAACGTGCT GAACCACTCG CTGGAGGTGG CCTACCTCTC CGGCGTCATG 
GCTTCCGAAC TGGGGCTGGA TCCCATCCCG GCCAAGCGCG CCGGCCTGCT GCACGATTTG 
GGCAAGGCGG TCGACCACGA GGTGGAGGGC AGCCACGCCG TCATTGGAGC CGACCTGGCC 
CGCCGTTTCG GCGAGCGACC CGAGATCGTG CACGCCATCG AGGCGCACCA CAACGACGTG 
GAGCCGTCCA GCGTGCTGGC CGTGCTCGTT CAGGCGGCCG ATGCCGTGTC CGCGGCGCGT 
CCCGGCGCCC GCAAGGAGAC ACTCGACGCC TACGTGAAGC GCCTCGAGAA GCTGGAGGAG 
ATCGCCAGCT CGTACAAGGG CGTGGAGCGC ACGTACGCCA TTCAGGCGGG TCGCGAGGTG 
CGCGTGATGG TGGAGCCCGA CACGGTGGAC GAAGCCGCCA CCACGGTGCT TGCGCACGAC 
ATCGCGCAGC GCATCGAGAA CGAGATGCAG TATCCCGGCC AGGTGAAGGT CGTGGTCATC 
CGCGAGAGCC GCGCGGTCGG CGTCGCGAAG TAG

Protein sequence

MPEFIWLIIG AVVGIALGFV VTRYLVNAST KRAAQEAESV VNDAKRQAET LRREAIIEAK 
DEALKLKQDA QAESKERLRE VRSAENRISQ REESLDRRVE SLDAREHQIS SMQGQLERRE 
RDLEEATREV NYRLERVAGM TPDEAKAELL DTLKDEVTHE SAAIIRDAEA RAKAEADKKA 
RSILSLAIQR VAADHSAETT VSTIHIPSDD LKGRIIGREG RNIRSFEQLT GTNLIIDDTP 
ECVTISCFDP VRREIGRVTM ENLVADGRIH PARIEEMFGK AEAFVNQRVQ EAGEQATFDT 
GIHDLHPELV RTLGRLRYRT SYGQNVLNHS LEVAYLSGVM ASELGLDPIP AKRAGLLHDL 
GKAVDHEVEG SHAVIGADLA RRFGERPEIV HAIEAHHNDV EPSSVLAVLV QAADAVSAAR 
PGARKETLDA YVKRLEKLEE IASSYKGVER TYAIQAGREV RVMVEPDTVD EAATTVLAHD 
IAQRIENEMQ YPGQVKVVVI RESRAVGVAK