Gene Elen_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3039
Symbol
ID	8417373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	3532022
End bp	3533266
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	69%
IMG OID	645026018
Product	FHA domain containing protein
Protein accession	YP_003183371
Protein GI	257792765
COG category	[T] Signal transduction mechanisms
COG ID	[COG1716] FOG: FHA domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTTC TTTCGAGATT CGAAGGCAGG ATGGAAGACA CGTTCGAGGG CGCTGCCGAC 
AAGATGTTCG ACGCCCCCAT CTCGCCGGTC CAGATAGCGA AAAAGGCCGA GAAGCAGATG 
CGCCGCGAGA AGATGGTGGG CGCCGGCAAG CAGTACGCGC CCACTTTGTA CACCGTGCTG 
GTGAACCCGG ACGACGACCG CCGCCTGATG GGCTACTACC CCACGCTGGC GGGCGAGACG 
GAAACGTACC TGACCGCGAA AGCTTCCGAG CAAGGCCTCG TGATGGACGG CCAGCCGCTC 
GTGCGCTTCA TCGTGGACGA GGACCTGAAG CACGGCAAAT TCGACATCAT CGCCGAAGCG 
GTGGCCGCTC CCATCATCGC GCAGCTGCGC GCCGAGGAAA TGCATCGTTA CGGCCTGGCC 
GCCGCTCCCG CGCCCGGCGG GTACGGAGCC CCCGCGCAGC CCTACCCCGC GCCGCGCCCC 
CAGGCGCCGG CTCCGCAGCA GTACGGCGGA TACAACCAGG GCTATGCCGC CCCGGCTCCC 
GCGCCCGCTC CGTACGGCGG CTATGACCAG CACGATCCCC AGGGCCAGTA CGACCCCGCG 
CCCATGAACG TGGACGCGTA CGGCCAGCCC CAGCAGCTCC CCTACGTGCC GGAAGACGAG 
ATCGACCGAT CCATCGATTA CGGCGAGTAC ACCTTCGACA GCCGCGACTT CGACGAGCAG 
CGCGACAGCA TCCAGCCTCT CGACCGTCCC GAAGCCGTGG ATCCGTTCGC CATCGGCGCA 
GCCGCAGCCG GTGCGGGAGT CGCCGCCGGC GCCGTTGCCG GAGCGGGTAT GGGCGCCGCG 
ACGTCGCAGC CCTACCCCGC CCCGCAGCCG CAACCGCAGG CCCAGCCGCG CATGGCCGCC 
GAAACCGTCG TGTTCGCCGG CGGGCAGCAA GCGGCGACCC CCATGCCCGC GCAGGCCGCG 
GTGCGCGCCC GCCTCATCGA CACCACGAAC AACCGCGCGT ACGACCTGGC GTCGGCGCGC 
CTGCTCATCG GCCGCGAGTC GAAGAACGAC ATTGCCGTGC ACGACGTGAA CGCATCGCGC 
ACGCACGCCG AGCTGCGCTT CGAGCCGCAA GGCGTATGGA CCATCACCGA CCTCGGCTCC 
ACGAACGGCA CCCTGGTGAA CGGCCGCGAG GTTGCCACCC AGCCGCTCTC CGAAGGCGAC 
CGCATCACTA TCGGCATGAC GAACTTCATG TTCACCCAAG CCTGA

Protein sequence

MGFLSRFEGR MEDTFEGAAD KMFDAPISPV QIAKKAEKQM RREKMVGAGK QYAPTLYTVL 
VNPDDDRRLM GYYPTLAGET ETYLTAKASE QGLVMDGQPL VRFIVDEDLK HGKFDIIAEA 
VAAPIIAQLR AEEMHRYGLA AAPAPGGYGA PAQPYPAPRP QAPAPQQYGG YNQGYAAPAP 
APAPYGGYDQ HDPQGQYDPA PMNVDAYGQP QQLPYVPEDE IDRSIDYGEY TFDSRDFDEQ 
RDSIQPLDRP EAVDPFAIGA AAAGAGVAAG AVAGAGMGAA TSQPYPAPQP QPQAQPRMAA 
ETVVFAGGQQ AATPMPAQAA VRARLIDTTN NRAYDLASAR LLIGRESKND IAVHDVNASR 
THAELRFEPQ GVWTITDLGS TNGTLVNGRE VATQPLSEGD RITIGMTNFM FTQA