Gene Elen_2895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_2895
Symbol
ID	8417226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	3361867
End bp	3363174
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	66%
IMG OID	645025873
Product	dihydropteroate synthase
Protein accession	YP_003183229
Protein GI	257792623
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes
TIGRFAM ID	[TIGR01496] dihydropteroate synthase [TIGR01498] 2-amino-4-hydroxy-6-hydroxymethyldihydropteridine pyrophosphokinase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGC GCTGCGCAAC CTATGAGTTC GATACGAGAA TGCCCATCGT CATGGGCATT 
CTCAACGTTA CCCCCGACTC CTTCTCCGAC GGAGGCCAGC ACGACGGCTT CGATGCCGCG 
CTGGCTCATG CCGAGCGCAT GGCGGAGGAG GGAGCCCGCA TAATCGATGT GGGCGGCGAG 
TCCACGCGGC CCGGCGCCGC GCCGGTGTCC GTGGACGAGG AGCTGGCGCG CGTGCTGCCG 
GTGGTGCGCG CATTGGCGCA GCGCGATGTG TGCGTGAGCA TCGATACGCG CCACGCCGAA 
GTTGCGCGCG CGTGCTTGGA AGCGGGCGCG GCCATCGTGA ACGACGTGTC CGGCTTCCGC 
GACCCCGCCA TGGTGGATGC GGTGCGCGAC AGCGATTGCG GGCTGGTGGT CATGCACATG 
CAGGGCGACC CCTCGACCAT GCAGAACGCG CCTTCGTATG ACGACGTGGT GGCCGACGTG 
CGCGAGTGGC TGCGCGACCG GGCTGCCGCT TTGGAGGCTG CGGGCGTCGC GCACGACCGC 
ATCTGCATTG ACCCCGGTCC CGGCTTCGGC AAGACGCCGT CGCAGACGCT GGAGCTGGTG 
CGCAACTTCC AAGAGTTCGT GCGTCTGGGC TACCCAGTGA TGGTGGCGGT GTCGCGCAAG 
AGCTTCTTGG GCTGGGCGTA CGGCATCGAC GAACCTTCTG CGCGCGACGA GGTTTCGGCT 
GCCGAGGCGC TCATGGCCTG CGAGCTGGGA GCCAGCGTGG TGCGCGCGCA CAACGTGGCG 
GCCACGGTTG CCGCGCTCGA AGGGCTGCGG CCCTACGCGC TCATCGGCAT GGGCTGCAAC 
GTCCCGCTTG TGGCCTCGCC CGGCGAGGAG CGCGAGGGCA AGATCGCCAT GCTCAACCAG 
GCCATCACCG AGCTGTGTTC GCTGCCCGAC TCGCAGATCG TCGACATCTC CAGCTTTTAC 
GAGAGCGAGC CGGCCTACTA CCTCGACCAA GATTCGTTCG TGAACGCCGT GGTGCTTTTG 
CGCACAGGTA TTCCGCCGAA AGAGCTTCTG GGCTACCTGC ATGCGGTGGA GAACAGCCTG 
GGTCGTGTGC GCGAGGTTCG GAACGGGCCG CGCACGTGCG ACCTCGATAT CCTCGACTAC 
CAGCTGTACG TCGTGGATGC CGATGTGCTC ACGTTGCCGC ATCCGCGCCT GCTGGAACGC 
GATTTCGTAG TGCAGCCCCT GTTGGAGCTG CTCCCTGGCC ACGTGCTTGC CAATGACGTG 
CCGGTTAGCG TCGATGGGGT TACGGTGGGG AAGAGCGTGC GGCTGTGA

Protein sequence

MIWRCATYEF DTRMPIVMGI LNVTPDSFSD GGQHDGFDAA LAHAERMAEE GARIIDVGGE 
STRPGAAPVS VDEELARVLP VVRALAQRDV CVSIDTRHAE VARACLEAGA AIVNDVSGFR 
DPAMVDAVRD SDCGLVVMHM QGDPSTMQNA PSYDDVVADV REWLRDRAAA LEAAGVAHDR 
ICIDPGPGFG KTPSQTLELV RNFQEFVRLG YPVMVAVSRK SFLGWAYGID EPSARDEVSA 
AEALMACELG ASVVRAHNVA ATVAALEGLR PYALIGMGCN VPLVASPGEE REGKIAMLNQ 
AITELCSLPD SQIVDISSFY ESEPAYYLDQ DSFVNAVVLL RTGIPPKELL GYLHAVENSL 
GRVREVRNGP RTCDLDILDY QLYVVDADVL TLPHPRLLER DFVVQPLLEL LPGHVLANDV 
PVSVDGVTVG KSVRL