Gene Elen_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1035
Symbol
ID	8415325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1253278
End bp	1254534
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	68%
IMG OID	645023998
Product	Glycine hydroxymethyltransferase
Protein accession	YP_003181395
Protein GI	257790789
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.314303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTCC AGTACGTATC CCAGACCGAT CCCGCCGTCG CCGATGCCAT GCGCCAGGAG 
CTTGCGCGCG AGCGCGACTC CGTCGAGCTC ATCGCTTCGG AGAACTTCAC GTCGTCCGCC 
GTCATGGAAG CCGTGGGCAG CGTGCTCACG AACAAGTACG CCGAGGGCTA TCCCCGCAAG 
CGCTACTACG GCGGCTGCGA GAAGGTCGAC CTCGTGGAGG ACCTCGCGCG CGAGCGCGCC 
TGCCAGCTGT TCGGCTCGAA CTTCGCCAAC GTGCAGCCCC ATTGCGGCGC GAACGCGAAC 
CTGGGCGCGT ACGAGGCGCT CATCGAGCTG GGCGACACGG TGCTGGGCAT GAGCCTGGCC 
GAGGGCGGCC ATCTCACGCA CGGCTCGCCG GTGAACTTCA GCGGCCGCCA CTACGACTTC 
GCCAGCTACG GCGTGGACGC CCAGACCGAG ACCATCGACT ACGACGAGGT GGAGCGTATC 
GCCAAGGAAG TGCGCCCCAA GCTCATCGTG GGCGGCGCGA GCGCGTATCC GCGCGTCATC 
GACTTCGAGC GCATGGCCGC CATCGCGCGC GAGGTGGATG CGTACTTCAT GGTGGACATG 
GCCCACATCG CCGGCCTCGT GGCCGCAGGC GCGCATCCCA GCCCCGTTCC GCATGCCGAC 
GTGGTGACGT CCACCAGCCA CAAGACCCTG CGCGGCCCGC GCGGCGGCTT CATCCTGTCC 
AATGACGAGG ACATCGCCAA GCGCATCGAC AAGGCCGTGT TCCCCGGCTC GCAGGGCGGC 
CCGCTCATGC ACGTCATCGC CGGCAAGGCC GTGGCGTTCG GAGAGGTCAT GCAGCCCGCC 
TACAAGGAGT ACATCGACCA CGTGGTGGAG AACGCGCGCA CGCTGGGGCA GGGCATGATG 
GACGGCGGTT TGCGCCTCGT GTCCGGCGGC ACCGACAACC ACCTGTGCCT CGTGGACCTC 
ACGCCGGCCG ACGTCACCGG CAAGGATGCC GAAAAGCTGT TGGAGAGCGT GGGCCTCACG 
GTGAACAAGA ACTCCATCCC CAACGAGCCG CGCAGCCCGT TCGTCACGAG CGGCATCCGC 
GTGGGCAGCG CTGCGGCCAC CACGCGCGGC TTCACGGCCG ACGACTTCTA CGAGGTGGGC 
CAGCTCATCG CCGCCACGGT GTTCAACGCC GAGAGCGAGG CGAAGCTCGC CGATGTGCGT 
GCGAAGGTGG ACGCCCTCCT TGCCGCGCAC CCTTTGTATC CCGAGCTCGA TTACTAG

Protein sequence

MALQYVSQTD PAVADAMRQE LARERDSVEL IASENFTSSA VMEAVGSVLT NKYAEGYPRK 
RYYGGCEKVD LVEDLARERA CQLFGSNFAN VQPHCGANAN LGAYEALIEL GDTVLGMSLA 
EGGHLTHGSP VNFSGRHYDF ASYGVDAQTE TIDYDEVERI AKEVRPKLIV GGASAYPRVI 
DFERMAAIAR EVDAYFMVDM AHIAGLVAAG AHPSPVPHAD VVTSTSHKTL RGPRGGFILS 
NDEDIAKRID KAVFPGSQGG PLMHVIAGKA VAFGEVMQPA YKEYIDHVVE NARTLGQGMM 
DGGLRLVSGG TDNHLCLVDL TPADVTGKDA EKLLESVGLT VNKNSIPNEP RSPFVTSGIR 
VGSAAATTRG FTADDFYEVG QLIAATVFNA ESEAKLADVR AKVDALLAAH PLYPELDY