Gene Elen_0883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0883
Symbol
ID	8415173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1080923
End bp	1082221
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	73%
IMG OID	645023848
Product	Flp pilus assembly protein CpaB
Protein accession	YP_003181245
Protein GI	257790639
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3745] Flp pilus assembly protein CpaB
TIGRFAM ID	[TIGR03177] Flp pilus assembly protein CpaB

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGATA ACCGAGACGA GATCCAGCGA CTTCGCGCCA TGAGGGCCGA GGCCATCAAC 
CGCGGCGACT TCGGCCGCGC CGACGCGATC GGCGCCGACC TCGCGCGCCT CGAGTCCGCC 
GCGGGCGGTA CCATCGACCC CATCACGGGC ATGCCCGCGG CATCGGCAAG CGTCCCGTCC 
GCACCGCAGG GGGCGCCCTT CCCGCAGCGC CGCGACGAGC GACCCGCGCA GGGCCGTCCC 
GCCTACGAGG ACCAGCACGG CCCCGCGCCG CGCCAATCGG CCCCGGCCCC GCAGCCCGCG 
TCCCCGTCCG CGCCGCAGGG AGCCCCTGCA CCCCGCCGCG AGGCGCGCGA CGCCCGCCGC 
ATGGAGGCCG ACGTCCACCA GCAGGAGAAT ACATACCGCC ACGAGCCCGC GCAGGAGAGC 
GCATACCGCC CCGAGCCGAG CCGCCCGGCC TACGCCGGCG ATGACCGCGG TGCGAAAACC 
GAGGCCGCTG CCGAGGAGCG CGGCGGTAGC CGCGAGGAGA AGCGCCGCGG GCGCTTCGGC 
AAGGCCGAGG GCAAGAAGGA TGCCAAGCCC GCCGAGGGGC GCGATCCCTC GACCGCGCCG 
CGGCGCGCGG CGCCCAAGCC CGCCCCCGCC GGCCCCTCGA AGGGCACGCG CGCGCTCACG 
GTGGTGGCCG CCGCGGCCAT CGCCGTGTCG GTGGGAGCCA CCGTGTTCTC CGGCATGCGG 
GTCGCGGAGT CCTCGGCGAT CATCGCCAAG AACGAGGCGA ATTCCGTTAA CGTCGTCGTG 
ACCAACCGCG ACGTCGCCGC CGGCGAGACC ATCACCGAAG CCGACCTCGA GACGCAGGCC 
GTCCCCAAGG CGTACTGCCC GACCGACGCC GCGACCAAGG TCTCGGATGT CGCCGGCCAC 
ACCTCGCTCA CCACGCAGAC CGCCGGGACC TCCATCTCGC TGTCCTCCCT CCAGGCATCG 
AGCTCGCCGG CGCACATCAC GTCGGCCATC GAGGACGGCC ATGTGGCCAT CGCCCTGTCG 
CTCGACTCCT CCAAGAGCCT GTCGCCGCTG CTGCGCGTCG GCGACCGCGT CAACGTCATG 
GCCGTCGTCT CCGACGGCGC GACGTCGAGC GCCGAGACGG TGTGCGCCAA CGTCAAGATC 
ATCGCCCTCG ATTCCGCCCT GTCCGGCTCG CCGGACGCCG GGTACTCGCT CGTGACGCTC 
GACGTCACCG AGGACCAGGC CGCGGCCATC GTGGCGAACC CGAACGTGAC GCTCACGGCC 
ATCCCGCAGA CCGCCGAGGG GGCCAGCGAT GCTGAATAG

Protein sequence

MNDNRDEIQR LRAMRAEAIN RGDFGRADAI GADLARLESA AGGTIDPITG MPAASASVPS 
APQGAPFPQR RDERPAQGRP AYEDQHGPAP RQSAPAPQPA SPSAPQGAPA PRREARDARR 
MEADVHQQEN TYRHEPAQES AYRPEPSRPA YAGDDRGAKT EAAAEERGGS REEKRRGRFG 
KAEGKKDAKP AEGRDPSTAP RRAAPKPAPA GPSKGTRALT VVAAAAIAVS VGATVFSGMR 
VAESSAIIAK NEANSVNVVV TNRDVAAGET ITEADLETQA VPKAYCPTDA ATKVSDVAGH 
TSLTTQTAGT SISLSSLQAS SSPAHITSAI EDGHVAIALS LDSSKSLSPL LRVGDRVNVM 
AVVSDGATSS AETVCANVKI IALDSALSGS PDAGYSLVTL DVTEDQAAAI VANPNVTLTA 
IPQTAEGASD AE