Gene Elen_0731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0731
Symbol
ID	8415021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	920276
End bp	921997
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	66%
IMG OID	645023702
Product	hypothetical protein
Protein accession	YP_003181099
Protein GI	257790493
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGAAAG CGCTGCTGCT CGTCATCGGC ATCGTCGCAG TGTGCTTTCT CATCGCGAAC 
GCCGATTACC TGGCGAGCTT CCTCGCGACG CTCAAGACCG GCGCGCTCGT GCCGCTGGTC 
GTGGCTTGCG TGCTCATGCT GGCGCGCCAC CTCGTGCAGG CGGCGTCCTA CGACGCGGCC 
TTCGAGGCGG TCGGCCATAA GACGGGCTTC TGGCACAACG TCGTGCTCAT CTTCTCGCTG 
GTGTTCATCA ACACGTTCTG CCTGTTCTCG GGGGCGACGG GCGTGGCGTT CATCATCGAC 
GACGCGCACC GCACGGGCGC GGACGCGGGC ACGTCCACCA GCGGCGCTAT CCTCTCGCAG 
ATCGGCTACT TCGCCGCCAT CCTCGTGATC TCCGTCATCG GCTTTCTCAC CATGCTGCTG 
TCCGGCAGCA TGAACACGCT GTTCCTCGTC GGGGGGCTGG CGTTGGCTGC GGTGCTGGCG 
GCGCTGTCCA GCATGTTCGT GGTGGGCTAC CGCAAACCGC GCGTGCTGTT CCGCCTGTTC 
ATCGGCATCG AGTCGCTCAT CAACAAGGCG CTGGGGCTGC TGAAGAAGCA TCTCAAGCCG 
GCCTGGGGGC GCAAGATGGC CAGCTCCTTC ATCTCGTCGG CGGGCATCCT CGCGAAGAAC 
CCGCAGGGCA CCATGGTCAC CGTGTCCTAC GCGTCGTTCT CGGCCATCCT CAACATGGCG 
TGCCTCGTGG CCATCGGCTA CGCGTTCGGC TTCGAGAACG TAGCCGCGCT CGTGGCGGCG 
TTCGCGGTGG CGGCCATCTC GGTCATCCTG AGCCCCACGC CTCAGGGCGT GGGCGTGGTG 
GAGGCGGCCA TCGCCGCCAT CCTCACGGCG CACGGATGCT CGCTGGCCAC AGCCACGGCC 
ATCGCGCTGG TGTACCGCGG TATCATGTTC TGGATCCCTT TCTGCATCGG CGCGCTGCTG 
CTGTCGCAGT CGGGGTTCTT CGCCGACAAG AAGAGCCCTA CCGAGGAGAA GCGCGCGAAG 
GACACGGCTT GGGTTTCGGG CACCATCGTG CTCATCGTGG GACTCGTGAA CATCGGCATG 
GCGTTGATTC CGCAGACGTT CAGGCCGTTC ACCGCGCTCA CGGATTGGAT CAACATGGGC 
GGCCTGCTCA TCGGTCCGTT CCTTATCGTG GGGAGCATCG TGCTCGTGGT GCTGGCCGTG 
GGACTCATCC TGCGCTTCCG TACGGCGTGG GCGCTCACGT TGGGCGTGCT CGTGCTGGTG 
GCTGGCGCGG AGTTCCTCTA CGTGAACACC GTGCAGGTTG CCGTGGCGGC TCTGCTGCTG 
GTGATGTGGC TGTTCTGGAA GCGCGACGCG TTCGACCGTC CTATCGCTCC GCAAGACGAC 
GCGCCGCGCC TCGTGCGCGA GTTCCGCGAG AACGTCGAGC GGTTCCGCGC TTGGCGCGCC 
AGGCGGGCTG CGGCGAAGGC AGCGGGTGAG CAGCCGCTCG CCGGCATCGG CAGCGCCATA 
GCCTCGCGCC GAGAAGAGGG CGGCGCGCGC TCACCTGCGA AAAGGAAAAC GGGTTGGGAA 
CAACGTGCCG AAAAAGGCGC GGAGATCATC CGCGAGGCTG GACATGAGGG TATACTGCCC 
TTTGGCGATG ATGCCGAGCC AGCGCCCGCG GGGGCGGCAA CGGCAGGCGT CGCCGATTCT 
GCAGCAATGA AGGAGGAGTC AAACCATGAT CGTGCTCGAT GA

Protein sequence

MKKALLLVIG IVAVCFLIAN ADYLASFLAT LKTGALVPLV VACVLMLARH LVQAASYDAA 
FEAVGHKTGF WHNVVLIFSL VFINTFCLFS GATGVAFIID DAHRTGADAG TSTSGAILSQ 
IGYFAAILVI SVIGFLTMLL SGSMNTLFLV GGLALAAVLA ALSSMFVVGY RKPRVLFRLF 
IGIESLINKA LGLLKKHLKP AWGRKMASSF ISSAGILAKN PQGTMVTVSY ASFSAILNMA 
CLVAIGYAFG FENVAALVAA FAVAAISVIL SPTPQGVGVV EAAIAAILTA HGCSLATATA 
IALVYRGIMF WIPFCIGALL LSQSGFFADK KSPTEEKRAK DTAWVSGTIV LIVGLVNIGM 
ALIPQTFRPF TALTDWINMG GLLIGPFLIV GSIVLVVLAV GLILRFRTAW ALTLGVLVLV 
AGAEFLYVNT VQVAVAALLL VMWLFWKRDA FDRPIAPQDD APRLVREFRE NVERFRAWRA 
RRAAAKAAGE QPLAGIGSAI ASRREEGGAR SPAKRKTGWE QRAEKGAEII REAGHEGILP 
FGDDAEPAPA GAATAGVADS AAMKEESNHD RAR