Gene Elen_1401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1401
Symbol
ID	8415699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1674744
End bp	1675787
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	68%
IMG OID	645024370
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_003181759
Protein GI	257791153
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000105022
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCA TCCATCGCGA GGACCAAGAG CAGCGCGAGC ACGTGGAGCT TTCCTGCGAC 
GCGGCGTTCG CCGACGAGAG CGACGGCCGC GACCGATCCG CCGAGCCCGA CATCCTGCGC 
ACCGACTACC AGCGCGACCG CGATAAGATC CTCCACACGA AGTCCTTCCG CCGCCTGTCG 
CACAAGACAC AGGTGTTCCT GGCCGCCGAG GGCGACCACT TCCGCACCCG TCTCACGCAC 
ACGCTGGAGG TGGCGCAGAT CGCCCGCACC ATCGCCCGCG CGCTGGGGCT GAACGAGGAT 
CTCGCCGAGG CCATCTCGCT CGGCCACGAC CTGGGGCACA CGCCCTTCGG GCATACGGGG 
GAGGAGGCGC TCGCGCGCTG CCTGGCGCGC CACAAGGGGA TCGACCCGGC ATCGCCCGAG 
GCGGAGGCGC TCTACCGCCA CAACGAGCAG AGCCTGCGCG TGGTCGAGCG CATCGAGAAC 
GGCGGCAAGG GACTGAATCT CACGTCCGAG GTGCGCGACG GCATCCTCAA CCACACCGGC 
GACCTGCGCG CCGAGACGCT GGAGGGGCGC ATCGTGGGCA CGGCCGACCG CATCGCGTAC 
GTCAACCACG ACATCGACGA CGCCATCCGC GCGGGCATCC TGCGCGAGGT CGACCTGCCG 
GCGTCGACGC ACGCCATGCT GGGCCCCGAC CATTCGTCGC GCATCGAGAC GCTCGTGCTC 
GACATGGTGG AGACGTCGGC CGCCGTCGAC GACATCCGCA TGAGCGACGC GGTGTGGAAC 
GCCATGATGG AGCTGCGGTC GTTCCTGTTC GAGCGCGTGT ACAGCGCCCC TGCCGTCACC 
GACGAGGTGG CGAAGGCGAC GCACCTCGTG GACGACCTGT TCGACTACTA CGTGGCGCAC 
ACGGGCGAAG TTCCGCAGGA GTACCGCGCC ATCTCCGAGG GCGACGACCT GCGCGCCGTC 
ACCGACTTCA TCGCCGGCAT GACCGACCGC TACGCCAAGA ACCTCTACCA AAGGCTGTTC 
ATCCCCAACG CGCTGCATTA CTAG

Protein sequence

MRIIHREDQE QREHVELSCD AAFADESDGR DRSAEPDILR TDYQRDRDKI LHTKSFRRLS 
HKTQVFLAAE GDHFRTRLTH TLEVAQIART IARALGLNED LAEAISLGHD LGHTPFGHTG 
EEALARCLAR HKGIDPASPE AEALYRHNEQ SLRVVERIEN GGKGLNLTSE VRDGILNHTG 
DLRAETLEGR IVGTADRIAY VNHDIDDAIR AGILREVDLP ASTHAMLGPD HSSRIETLVL 
DMVETSAAVD DIRMSDAVWN AMMELRSFLF ERVYSAPAVT DEVAKATHLV DDLFDYYVAH 
TGEVPQEYRA ISEGDDLRAV TDFIAGMTDR YAKNLYQRLF IPNALHY