Gene Elen_1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1118
Symbol
ID	8415408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1347629
End bp	1348843
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	645024080
Product	molybdenum cofactor synthesis domain protein
Protein accession	YP_003181477
Protein GI	257790871
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000621722
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000000000046645
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGAGAGA AGATCATGGA CGGTTTCCCG TCGCGCGAAG AGGCGCTGGC CGACTTCTTC 
GCAGCATGGG AGCCGGCGAG GAGCGTCGAG TACGTGGCGC TCGACGACGC GGTGGGACGC 
GTGCTCGCCT GCGACCTGGC GTCGACGAAC ACGCTGCCGG TGGTGCGCGC CTCGTCGTTC 
GACAGCATCG CGGTGAAGTC GGCAGCGTTC GCGAACGGCA TGCCCGACAC AAGCAGCTGG 
AAGCCCGGCG TGGATTACGT GCGCGCCGAC ACCGGAGACG ACTTCCCCGA CGCGTTCGAC 
GCCGTGGTGA TGATCGAGAA GGCGGTCGTT CGGGAGGACG GATCGGTAAC GTTCGACGAC 
GACGTGACCG TCGAGCCCGG TTCGGGCGTG CGGCCCGCCG GCTCCACGCT GCGCGCGGGC 
GAGCCGCTCA TGAGCGCCGG CAGCATTATC CGACCCACCG ACCTGGCCGC TCTCGCCATG 
GGCGGCGCCA CGATGGTGCC CGTGCGCGTC AAACCGCGCG TGGCGTTCAT TCCCACGGGC 
AGCGAGCTCG TACCCGCAGG CATCAAGCCC CGACGAGGTC AAAACGTGGA CACGAACAGC 
CTCATGTGCA AGCACCTCCT CATCGAGTAC GGTGCCGAAC CCGTGGTGTT CCCCCTCGTG 
CACGACGATC CCGTCGAGCT CGAACGCGCC TTCGAGGCGG CGCTCGCCAC CGCCGACGTC 
GTGGTGGTCA ACGGGGGATC GGCCCTCGGC GAGGAGGATT TCAACGTGAA GCTGATCGAA 
CGCCGCGGGC AGGTGGTGCA CCATTACATC GCCGCCGTGC CGGGACGGCC GCTCATGCTG 
GCCGTAGCCG ACGGCAAACC GGTCGTCGAT CTGCCCGGCC CCACCATGGC CGCCTACTTC 
GGCTCCGAAT GGTGCCTGCA AGCGATCACG GCGCGCATCC TGGGAATTCC GCTGCGCCGC 
CGCCCCGTCG TGCAGGCGCG GGCGGATGCC GCGAAGACGA GCATCCCCAA GATGGCGAAC 
ATAGCCCGCG TACACGTGAC GCGCGACGAC GAGGGCTACG CGGCACACTT CCTCGATTTC 
AAAGCCGGGG AGCTGGCCGC GTGCATGACG TCGAACGCGC AGCGCGTCTC GCCCCTCGGC 
GAAGCGGGAT GGGCCGAAGG CGACCTTTTG GACGTGGAGT TGCTGCGCGG CGAGGAGTTC 
GTCGATCAAG GCTAG

Protein sequence

MGEKIMDGFP SREEALADFF AAWEPARSVE YVALDDAVGR VLACDLASTN TLPVVRASSF 
DSIAVKSAAF ANGMPDTSSW KPGVDYVRAD TGDDFPDAFD AVVMIEKAVV REDGSVTFDD 
DVTVEPGSGV RPAGSTLRAG EPLMSAGSII RPTDLAALAM GGATMVPVRV KPRVAFIPTG 
SELVPAGIKP RRGQNVDTNS LMCKHLLIEY GAEPVVFPLV HDDPVELERA FEAALATADV 
VVVNGGSALG EEDFNVKLIE RRGQVVHHYI AAVPGRPLML AVADGKPVVD LPGPTMAAYF 
GSEWCLQAIT ARILGIPLRR RPVVQARADA AKTSIPKMAN IARVHVTRDD EGYAAHFLDF 
KAGELAACMT SNAQRVSPLG EAGWAEGDLL DVELLRGEEF VDQG