Gene Elen_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1451
Symbol
ID	8415749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1730823
End bp	1731941
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	67%
IMG OID	645024420
Product	hypothetical protein
Protein accession	YP_003181809
Protein GI	257791203
COG category	[S] Function unknown
COG ID	[COG1915] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00300] conserved hypothetical protein TIGR00300

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.553711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.492787
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTCG CATTGAACCC CTACACCGCT CCCGACTTCC ACCGCGAGCC GCTGGCCGGC 
GCGCCCGACG CCGTGCTGCT GCCGGCGCCG AAAGACGGCG TGGCGCCAGA AGGCTACCAC 
GCGATGAGCA TCTACCCCGA GTACTTCAAG ATCGACGGCG CATGGCTGCT CGCGGAAGAC 
AGCCGCATGG ACTGCGTTCC CGTCTGCGAG GACGGACGCA TCTTCGTGCG CGAGTTCCGC 
CACATCCGCG CGGGAGATGC CATCGTGTGC GGGCGCACCG AGTCGGGAGA GCAGGGCATC 
TACGTCCACA CGACCGGGTT CGACCCCGCG CCGGACGGCG AAGGCGAGCT GGCCGACGCA 
GGGCGCCACG CCGACAACTT CGCCTTCCGC TTGGGGCGCT CGCGCGAGAC GGCGTTCTCC 
CGCGAGTACG ACGAGCTCTA CGAGCTGCTG AAGCACGAGC GCGAACACGG CTACGTCGTG 
TGGGTGATGG GGCCGGCGTT CTCGTTCAAC GGCTTCTCGC GCACGGCGTT CTCCAAGATC 
ATCGAGGCGG GCTACGTCGA CGCGGTGTTC GCCGGAAACG CGCTGGCCAC GCACGATCTG 
GAGGGCTCTT ACTTCCACAC GGCGCTCGGC CAGGACATCG AGACGCAGGA GAACCGCCCG 
CTCGGCCACT ACAACCACCT GGACACCATC AACCGCGTGC GGCTGTACGG CTCCATCGGC 
CGGTTCATCG AGGAGGAGCA GGTGTCGGGC GGCATCATGC ACGCGTTGGA GAAGAAGGGC 
GTGCCCTACG TGCTGGCCGG CTCCATCCGC GACGACGGCC CGCTTCCGTG CGTGCTGGGC 
AACGCCTACG ATGCGCAGGA CGCCATGCGC TCCCACCTGC GCAAAGCCAC CACGGTCGTG 
TGCATGGCCA CCATGCTGCA CACCATCGCC ACGGGCAACA TGACGCCATC GTACCGCGTG 
CTCGCGGACG GCACCGTGCG CCAGGTGTAC TTCTACTGCG TGGACATCGC CGAGTTCGCG 
GTGAACAAGC TCATCGACCG CGGCTCTCTG GCCTCGCGCG GCATCGTGAC GAACGTCCAG 
GACTTCATCG CCAACGTGGC GAAGGGCCTG GGGTTGTAG

Protein sequence

MSFALNPYTA PDFHREPLAG APDAVLLPAP KDGVAPEGYH AMSIYPEYFK IDGAWLLAED 
SRMDCVPVCE DGRIFVREFR HIRAGDAIVC GRTESGEQGI YVHTTGFDPA PDGEGELADA 
GRHADNFAFR LGRSRETAFS REYDELYELL KHEREHGYVV WVMGPAFSFN GFSRTAFSKI 
IEAGYVDAVF AGNALATHDL EGSYFHTALG QDIETQENRP LGHYNHLDTI NRVRLYGSIG 
RFIEEEQVSG GIMHALEKKG VPYVLAGSIR DDGPLPCVLG NAYDAQDAMR SHLRKATTVV 
CMATMLHTIA TGNMTPSYRV LADGTVRQVY FYCVDIAEFA VNKLIDRGSL ASRGIVTNVQ 
DFIANVAKGL GL