Gene Elen_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1803
Symbol
ID	8416107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2113754
End bp	2115313
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	63%
IMG OID	645024774
Product	diguanylate cyclase
Protein accession	YP_003182157
Protein GI	257791551
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain [TIGR01168] Gram-positive signal peptide, YSIRK family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00715144
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.974304
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAAA CAACAGGCAA AAACCTGAGA ACAACGCGGT TCTCGTTCCG GCGCATGGCC 
TTGTACGGAG TCGCGCTCGC GTTGGCGCTG CTTATCGCAT CCGCTGTGAT GGGCGCGGTT 
CTGGCCGTGC GGGATATGCG CGATCGGGCC GACGTATCGC TGACGAACGC CAAGGCGCGC 
ATCGAGTCGA GCGTCGCGGA GTCTTTCAAG CTGCTGGAAT CGTTGGCCGA GCAGCCGACG 
CTGTACGAAC GCTCCGTCTG GGTCATGGAC AAAGTGACGA TGCTCGACCA GGTGAACGAG 
CATTTCGGCT ACTTCCTGCT ATGCTACGTC GATGACGAGA TGAACGTGTG GGACGTGACA 
GGTTCGGCGA GCCTCGCCAG CCGCGATTTC ATGCAGAAAT GCTATTCCAC GGGTCAGGGC 
TTGGTCACCG ACAGCTTCGC GGCCGGCGCC GACGGCGTGA CGCTCAACTA CGTCGTGCTC 
GTGCCCCTCT TCGACGGCGG CGAGATGACG GGATCGCTGT TCGTCTCGCT GTACTTCGAC 
GATATGGTGC GCATCCTCGC CGAGAGCGCC GTCGGCCCCG ATGTGGGATC GGTGCTCATC 
GGAAGCCGGG GCCAGACGAT GTCGGCCACG TCGGGTTTCG TGTACGACGA CATGTTCCTC 
GACCCGCTTC GCAGCAGCAT CGCGTTCGGT ATGACCGCCG ATGTCGTGGA GCGGGAGCTG 
ATGGCGCTCA ACCCGGTGTC CTTCTGGACC GTAGACGGAT TGGATGTACG ATACTACACG 
GCCGTTCCTA TCGCCGATAC CGCATGGGAC GCCGTATGCG TGACGAGCTT CTGGGACGCG 
TACACCAAGG TCATGGCCGC GCTCGCTCCG CTGATCGCCG CCGGTTTGGC GATCGTCGCG 
GGCGTGTTCC TGTTGCTTCG CCGCGATTTC ATGTGTCAAA TGGAAAACGC CCGCATGCTT 
GAGAAGTCCG TCGAGGAGCT GCAGAGGAAA GTGTACGACG ATGGGCGATC GGCTGAAGCC 
GACATCGCCG ACATCCTCGA GCTCACCTCG TCGGGCCTGT CCGACGGGCT GACCGGCACC 
GTCACGCGCT CGGTGTTCTC CAGCAAGCTG GCGAGTGCGC TCGAGAACGC GCGGGACGGC 
GGATCCCTGT ACGCCCTCTG CTTCATCGAC CTCGACGACT TCAAGACGAT CAACGACACG 
TATGGCCATG CGACCGGCGA CGCGGCTTTG AAATCCATCG GCTACGCCCT GCGCGGCTAC 
GAGCGGCGCT ACGACGGCAT GGTGGGACGT TACGGCGGCG ACGAGTTCGT GATGCTCATG 
ACCGACATCG ACGACGAAGG CGAGCTGCGC GCCGTGCTCG ACGAGATGGT GGGCGACCTT 
CATGTGGACA TCCAGGTGGG CGACGCGGTG GTCTCGGTGC ATTGCAGCAT CGGCGCGGCC 
GTGTGGGACC GGGTTTCCGA CGCCGATGCG CTTTTGGGGC AGGCCGACAA CGCTCTGTAT 
CGCGTCAAGC AGCATGGCAA GGAAGGGTAT TTCGTGTTCG GCGAAGAGGA TGCGCAGTGA

Protein sequence

MAKTTGKNLR TTRFSFRRMA LYGVALALAL LIASAVMGAV LAVRDMRDRA DVSLTNAKAR 
IESSVAESFK LLESLAEQPT LYERSVWVMD KVTMLDQVNE HFGYFLLCYV DDEMNVWDVT 
GSASLASRDF MQKCYSTGQG LVTDSFAAGA DGVTLNYVVL VPLFDGGEMT GSLFVSLYFD 
DMVRILAESA VGPDVGSVLI GSRGQTMSAT SGFVYDDMFL DPLRSSIAFG MTADVVEREL 
MALNPVSFWT VDGLDVRYYT AVPIADTAWD AVCVTSFWDA YTKVMAALAP LIAAGLAIVA 
GVFLLLRRDF MCQMENARML EKSVEELQRK VYDDGRSAEA DIADILELTS SGLSDGLTGT 
VTRSVFSSKL ASALENARDG GSLYALCFID LDDFKTINDT YGHATGDAAL KSIGYALRGY 
ERRYDGMVGR YGGDEFVMLM TDIDDEGELR AVLDEMVGDL HVDIQVGDAV VSVHCSIGAA 
VWDRVSDADA LLGQADNALY RVKQHGKEGY FVFGEEDAQ