Gene Elen_1829 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1829
Symbol
ID	8416133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2149863
End bp	2151305
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	66%
IMG OID	645024799
Product	General substrate transporter
Protein accession	YP_003182182
Protein GI	257791576
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.392144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.18053
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG TAAAGCATAT GACCCAGGTA ACGAGCCCTC CCATGGGCGA GGTCGCCGAC 
GGCGCCAAGC AGATCGGCGG GGACGTGGTC CACAAGGTGA AGAAGTCGGC CAAGAAGACC 
ATGGACGACG TGGCCATGAC GCCCTTCTTG CGCAAGATCA CGTTCTTCTC GAGCGGCGGC 
TCGTTTTTGG ACGGGTACGT GCTCTCGCTC ATCGGCGTGG CGCTCACGCA GATCACACCG 
CTGTTCAACC TCGACGAGGC GTGGAGCGCG GCCATCGGGG CGTCGGTTTT GCTGGGCATC 
TTCGTGGGCA CGATCGCGGG CGGCTACCTC ACCGACCGCA TCGGGCGCAA GAAGATGTTC 
ATCGTCGACA TCGTGGCCAT CGGAACCTTC TCCATCCTGA GCGTGTTCTG CGCCGACCCG 
CTCCAGCTCG TGGCGGCGCG CTTCTTCATC GGCGTGTTCG TAGGCGCCGA CTACCCGATA 
GCCACCTCGC TCATCGCCGA GTTCACGCCC AAGCAGCACC GCTCCATCTC CATGGGCATG 
GTGTCGGCCG CCTGGTACCT CGGCGCCACG GTGGCGGCGT TCGTGGGGTA CTTCCTGTAC 
AGCGTGCCCA ACGGATGGCA GTGGATGCTC GGCTCGGCCG TCATCCCCTG CATCATCCTG 
CTGGTCGGGC GGCACGACAT CCCCGAGTCG CCCATGTGGC TGGCTCAGAA AGGCCGCACC 
GAGGAGGCCG ACGCCGTCAT GCGGCGCGTG TTCGGCGAAG GCGTGGAGCT CGAGCTGGAG 
GATCCGGGCG AGAAGACCAG CCTGCGCAAG GTGTTCGCGG GCGGCTACGC CAAGCGCATC 
GTGTTCTTGG GCATCCTGAC GCTGTGCCAG GTGGTGCCGA TGTACGCCAT CTACACGTTC 
GGCCCCGAGA TCATGACGGC CTTCGGGCTG GGGGAGGGCC ACGAGGCCAT CCTGGGCGAG 
AGCGTGGTCA GCCTGTTCTT CCTGATCGGT TCCATCCCGG CCATGTTCTG GCTGAACTCG 
ATGGGCCGCC GTCCGCTGCT CATCCGCTCG CTCGCCCTCA TGGCGGTGGG CCTGGTCATC 
CTGGGCGTGT TCCCGGACGC CCCCATCTAC GTGATCATCC TGGGGTTCGG CCTGTACGCG 
TTCTTCAGCG GCGGCCCGGG CATCCTGCAA TGGCTGTACC CCAACGAGCT GTTTCCCACC 
GAGGTGCGCG CCTCGGCGGT GGGCATCGCC ATCGCGTTCT CGCGCATCGG CACTATCATC 
GCCACGTACG GCACGCCGCT GTTCCTGGCC GCCTACGGCA TCGGCCCCAC CATGCTGATC 
GCGGCGGGCC TCGTGATCCT GGGCCTCGTG CTGTCGGCGT TCATGGCGCC CGAGACGAAG 
GGCAAGTCGC TTCTGGAGAC GAGCTCGCTC GACGAGGGGG ACGCGCACCC GCGCGGGGCG 
TAG

Protein sequence

MSNVKHMTQV TSPPMGEVAD GAKQIGGDVV HKVKKSAKKT MDDVAMTPFL RKITFFSSGG 
SFLDGYVLSL IGVALTQITP LFNLDEAWSA AIGASVLLGI FVGTIAGGYL TDRIGRKKMF 
IVDIVAIGTF SILSVFCADP LQLVAARFFI GVFVGADYPI ATSLIAEFTP KQHRSISMGM 
VSAAWYLGAT VAAFVGYFLY SVPNGWQWML GSAVIPCIIL LVGRHDIPES PMWLAQKGRT 
EEADAVMRRV FGEGVELELE DPGEKTSLRK VFAGGYAKRI VFLGILTLCQ VVPMYAIYTF 
GPEIMTAFGL GEGHEAILGE SVVSLFFLIG SIPAMFWLNS MGRRPLLIRS LALMAVGLVI 
LGVFPDAPIY VIILGFGLYA FFSGGPGILQ WLYPNELFPT EVRASAVGIA IAFSRIGTII 
ATYGTPLFLA AYGIGPTMLI AAGLVILGLV LSAFMAPETK GKSLLETSSL DEGDAHPRGA