Gene Elen_0404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0404
Symbol
ID	8414688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	517148
End bp	518539
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	65%
IMG OID	645023379
Product	sodium:neurotransmitter symporter
Protein accession	YP_003180782
Protein GI	257790176
COG category	[R] General function prediction only
COG ID	[COG0733] Na+-dependent transporters of the SNF family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.630301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.211646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACGTG AGAAATTCGG ATCCCGTTTA GGGTTCATCC TGATCAGCGC GGGATGCGCC 
ATCGGGCTGG GGAACGTGTG GCGCTTCCCT TACATCGTGG GGCAGTACGG GGGCGCGGCA 
TTCGTGCTTT TGTATTTGCT GTTCTTGGTG GTGTTCGCGC TGCCCATTCT CGTGATGGAG 
TTCGCGGTGG GCCGGGCGAG CCAGAAGGGC GTCGCGCGCA GCTTCGACGA GCTGGAGCCG 
GCCGGGTCGA AATGGCATCG GTTCAAGTGG GCGGCCCTTG CGGGCAATTA CCTGCTGATG 
ATGTTCTACA CCACGGTTGC CGGATGGATG CTGGCGTTCA TGGCGTTCAG CGGCGCGGGC 
ACGTTCGAGG GCCTGGACGC CGGCGCCGTC GAAGGGGTGT TCAACGGGCT TCTGGCCGAC 
CCGCTTATGA TGGTCGCGTT CATGCTGGTC GTAGTGCTGA TAGGCGTGTT AGTGACGCGG 
GCCGGCTTGC GCAACGGCGT GGAGCGCATT ACGAAGACGA TGATGGCCGC CCTGTTCGCC 
GTCCTTGCCG TGCTGGTGGT GCGCGCGGTC ACGCTTCCGG GCGCCGAAGA GGGCCTGTCG 
TTCTATCTCA TGCCCGATTT CGCGAAGCTG TTCGAAGGCG GGTGGGGGAC GTTCGTCGAT 
GCCGTGTTCG CGGCTATGGG CCAGGCGTTC TTCACGGTGT CGGTGGGCGT GGGGTCCATG 
TCCATCTTCG GCAGCTACAT CGATAAACGC TACCGCCTTA CGGGCGAGGC GCTGCGCGTC 
GCGGGGCTGG ACACGCTCGT GGCCATCATG GCGGGCCTCA TCATCTTCCC GGCGTGCTTC 
GCGTTCGGGG TGGAGCCGGG CAGCGGCCCC GGCCTGGTGT TCATCACGCT TCCCAGCGTG 
TTCAGCCAGA TGCCGGTGGG GCAGCTGTGG GGCACGCTGT TCTTCCTGTT CATGAGCTTC 
GCCGCGCTGT CCACGGTGGT GGCGGTGTTC GAGAACATCA TGAGCTTCAG CATGGACGAG 
TGGGGCTGGT CGCGCAACCG CGCTTGCCTG GTGAACGGCA TCGCGCTGGC GCTGTTGTCG 
CTGCCGTGCG TACTGGGCTT CAACGTGTGG GCGGGCGTGG AGGTGCCGGG TATCGGCAAT 
ATCCAGGCCA TCGAGGACTT CCTCATGTCG AACAACGTGC TGCCGCTGGG CGCTCTGGTG 
TTCCTGCTGT TCTGCACGTC CAAGCGGGGC TGGGGTTGGG ATGCGTTTCT GCGCGAGGCC 
GACACGGGCG AGGGCACGCG CTTTCCTCGC TGGGCTCGCG GCTACGTGCG CTTCGCGCTG 
CCCGTGCTCA TCCTGGCGGT GTTCGTGGCC GGCTACGTAC CCATCGTGCA AACCTGGCTG 
GGGCTGGGGT AG

Protein sequence

MVREKFGSRL GFILISAGCA IGLGNVWRFP YIVGQYGGAA FVLLYLLFLV VFALPILVME 
FAVGRASQKG VARSFDELEP AGSKWHRFKW AALAGNYLLM MFYTTVAGWM LAFMAFSGAG 
TFEGLDAGAV EGVFNGLLAD PLMMVAFMLV VVLIGVLVTR AGLRNGVERI TKTMMAALFA 
VLAVLVVRAV TLPGAEEGLS FYLMPDFAKL FEGGWGTFVD AVFAAMGQAF FTVSVGVGSM 
SIFGSYIDKR YRLTGEALRV AGLDTLVAIM AGLIIFPACF AFGVEPGSGP GLVFITLPSV 
FSQMPVGQLW GTLFFLFMSF AALSTVVAVF ENIMSFSMDE WGWSRNRACL VNGIALALLS 
LPCVLGFNVW AGVEVPGIGN IQAIEDFLMS NNVLPLGALV FLLFCTSKRG WGWDAFLREA 
DTGEGTRFPR WARGYVRFAL PVLILAVFVA GYVPIVQTWL GLG