Gene Elen_1423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1423
Symbol
ID	8415721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1695907
End bp	1697469
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	66%
IMG OID	645024392
Product	protein of unknown function DUF6 transmembrane
Protein accession	YP_003181781
Protein GI	257791175
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000166292
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGAAG AGGGTTCGAT TCAAGTGGCG GAAACGGTGG CGGGGAACCG TCATGTTGTG 
CGCGGCATCG TATGCGCGCT TGCGGGCGGC ATCTGCTGGG GCTTCTCGGG CACGTGCGCC 
CAGCTGCTCA TGAACGACTA CGGCGCTCCC GCCACGTGGA TCACCTGCGT GCGCATGGTC 
ATCGCCGCCG TGTTCTTCCT GTTCCTTACC GCGGTGCGCA ACTGGCGCGA TCTCGTAGCG 
GTGTTCCGAG ACTGGCGCTC GCTCGCGCAG ATCGCGGCGT TCGCCATATT CGGCGTGCTG 
TTGACCCAGC TCAGCTACTT GAACGCCATC TCGTACACGA GTGCCGGCGT GGGCACTACC 
ATCGAGCAGG TGGGGCTCGT GCTCATCATG CTGTACGTGT GCGTTCGCGC CAAGCGCCTG 
CCGCGTGCTC GCGAGGCGGC AGGCCTCGTG TTCGCGCTGG GCGGCATGCT GATCATCGCC 
ACGCAAGGCG AGATCGACCA GCTGGCCATC CCCGCCGAGG GATTGGCCTG GGGCCTCGTG 
TCGGCCGTGG CTTTGACGTT CTACACCCTC ATGCCCGTGC GCGTGCTGAA GAAGTGGGGC 
TCCATGCTGG TGACGGGCCT TGCCATGCTG TTCGGCGGAT CGGCCGCCTC GGTGGTGGTG 
CAGCCGTGGA CCATGCCTGT GAACCTGCCG CTCGGCGGCA TCGCGGCGCT GGTTGCCATC 
GTGATCGTGG GCACCTTGGG AGCCTACATG CTGTATCTGC AGGGCGTGAA CGACGCAGGC 
CCCGTCAAGG CGAGCCTTCT GTGCTGCGTC GAGCCCGTTT CGGCCATGAT CCTCGCGCTC 
GCGTGGCTCC ATACGCCGGT GAGCGGCTGG GACCTCGCAG GATGCGCGCT CATCGTGATC 
ATGATCTTCC TCGTCACCGA GCGAGAGCCG AAAACGGAGC AGGCCGCCGA GGGCGAGGGC 
GCGCTCGCCG ACGCCTACGA CGACCCGCCG CTGTTCGCAG GCCGCGCTTC GGTGCTGGGC 
TACTACACCA GCCGTCCGGC CACGCGCGAT GATTTCGAGC GTGCCACGGC GCTGCTCGAC 
GTCGGGCATC AGACGTTCGC GGAGCTCGGC ATAGACGAGG GTCGGAGCAA GAAGTACCCA 
TCGGCGCGTC GTCTCATGCA CAGCATCAAG AACGGCACGA CGCACGTCAT CGAGGATGCC 
CACGGCCGCA TGATCGCGAT GTTCGCCGTG TCCTTCTCGC CTGACAAGAA CTACGAGCGC 
CCCATCGACG GCGCTTGGCT CACCGACACG TCGGCCGAAC CGCAGCCCTA TGCGGAGCTG 
CATTGGGTGG CCGTCGACTA TCCGGCTCGC CGCCGCGGCG TCGGCATGTT CATCCTCGAC 
AAGGCCGACC AGATCGCCCG TGCGGGCGGC CGGTCCAGCA TTCGCGCCGA CGTCTACGAG 
CTGAACGGGC CCATGCAGAA CCTGCTTGAG AAGCACGGAT ACGAACGCTG CGGAACCATC 
ACGATCAAAG ACGTGTTCGG GCGTGTGAAA CATCGCGTGG GCTACGAGAG AATGTTGCGT 
TGA

Protein sequence

MREEGSIQVA ETVAGNRHVV RGIVCALAGG ICWGFSGTCA QLLMNDYGAP ATWITCVRMV 
IAAVFFLFLT AVRNWRDLVA VFRDWRSLAQ IAAFAIFGVL LTQLSYLNAI SYTSAGVGTT 
IEQVGLVLIM LYVCVRAKRL PRAREAAGLV FALGGMLIIA TQGEIDQLAI PAEGLAWGLV 
SAVALTFYTL MPVRVLKKWG SMLVTGLAML FGGSAASVVV QPWTMPVNLP LGGIAALVAI 
VIVGTLGAYM LYLQGVNDAG PVKASLLCCV EPVSAMILAL AWLHTPVSGW DLAGCALIVI 
MIFLVTEREP KTEQAAEGEG ALADAYDDPP LFAGRASVLG YYTSRPATRD DFERATALLD 
VGHQTFAELG IDEGRSKKYP SARRLMHSIK NGTTHVIEDA HGRMIAMFAV SFSPDKNYER 
PIDGAWLTDT SAEPQPYAEL HWVAVDYPAR RRGVGMFILD KADQIARAGG RSSIRADVYE 
LNGPMQNLLE KHGYERCGTI TIKDVFGRVK HRVGYERMLR