Gene Elen_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1474
Symbol
ID	8415772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1763530
End bp	1765212
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	62%
IMG OID	645024443
Product	sulphate transporter
Protein accession	YP_003181832
Protein GI	257791226
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.525598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAACGCG ACAAGATCAA ACCGATACTT TTCAGCATCA TCAAGCACAC CGACAGCGAA 
GAGCTCAAAC GACAGCTTCC CAAAGACGTT GTTTCGGGCG TCATGGTGGC CGTGGTGGCG 
CTGCCTCTTT CCATCGCGCT GGCCATCGCT TCGGGCGTGA GCCCTGAGCA AGGCCTTTAC 
ACGGCCATCG TCGCCGGGTT CCTCATCGCG TTCCTCGGCG GCAGCCGCGT GCAAATCTCG 
GGCCCCACGG CGGCGTTCGC CACCATCGTT GCAGGCATCG TGGCAACCGA CGGCATGGAC 
GGCCTCGTCG CAGCCACCGT CATCGCCGGC GTGCTGCTCA TGCTGATGGG CTTCTTCAAG 
CTGGGATCGC TCATCCGGTT CGTTCCCTAC ACCATCACCA CGGGCTTTAC GGCAGGCATC 
GCCGTGACCC TCGTCATCGG CCAAGTCAAA GACTTCCTCG GCCTCGCCTT CCCCGCCGGC 
GCGCCCACGG TCGAGACTAT GGACAAGCTG CAGGCCGTCG CCCAAAGCAT CGGAACGGCC 
AACTGGCAAG CGTTCGTCGT GGGAGCGGTC TGCCTCGCCA TCCTGTTCGC CTGGCCTAAG 
GTCAGCGAAC GCATCCCCGG ATCCCTTGTC GCGCTCATCG TGGGAATCGC CCTGGTCAGC 
GGCTTCGGCA TGCAGGTGAG CACCATCGGT GACCTGTACG CCATCAGCAG CGACCTGCCC 
GAATTCCGCA TTCCCCAACT CAACGTCGAC CTGCTGGCCG ACCAGCTTCC CAACGGCATC 
ACCATCGCCA TCCTGGCCGC GATCGAATCG CTCCTGTCCT GCGTCGTCGC CGACAGCATG 
ATCAGCTCGC ACCACCGCAG CAACATGGAG CTGGTTGCGC AGGGCGTGGG CAACATCGGC 
TCGGTACTAT TCGGCGGAAT CCCCGCAACC GGCGCCATCG CGCGCACCGC CGCGAACGTG 
AAGAACGGAG GCAGAACGCC CGTCGCCGGC ATGACCCATG CGCTCGTGCT GCTGATCGTC 
CTCGTGTTCT TCATGCCCTA CGCGGCTCTC ATCCCCATGC CGACCATCGC GGCCATCTTG 
CTGCACGTCG CCTACAACAT GTCGGGATGG CGCAATTTCG CACACTTGTG CAAGACGGCC 
TCCCGAGGAG CGGTGGCCAC GCTGCTGCTC ACCTTCGCGC TGACCGTCGT GTTCGACCTG 
GTGGTGGCGA TTGCCGTGGG CATGTTGATC ACGGTCGTCC TGTTCATGAA GATGGTGAGC 
GAGGAGACCG AGGTTCGCGG CTGGAAATAC TACTGCGACG AGGATTCCGA GGTCACGCAC 
CTGCGCGAAC TCCCTGAAAG CGTGCGCGTG TACGAGATCA ACGGACCCAT GTTCTTCGGC 
ATGACCGACC GCATATCCGA CATATCGGTG AAATCCTTCA CGAAGTACCT GATCATCCGC 
ATGCGAGGCG TGCCATCGCT CGATTCGACG GGCATGAACG CGCTGGAGAA CCTCTACGGG 
TACTGCCGCG AGAACGGCGT CAGCCTCATC TTCTCGCACG CCAACGAGCA GCCGATGAAA 
ACCATGCGCC GCGCTGGTTT CGTGGACATG GTGGGAGAAG ACCATTTCCG CAGCAATATC 
GACGATGCAA TCGCTTACGC GCGCAAGCTG CTGGACGAAG AGGGGGAAAC GGCATCGGCC 
TAG

Protein sequence

MQRDKIKPIL FSIIKHTDSE ELKRQLPKDV VSGVMVAVVA LPLSIALAIA SGVSPEQGLY 
TAIVAGFLIA FLGGSRVQIS GPTAAFATIV AGIVATDGMD GLVAATVIAG VLLMLMGFFK 
LGSLIRFVPY TITTGFTAGI AVTLVIGQVK DFLGLAFPAG APTVETMDKL QAVAQSIGTA 
NWQAFVVGAV CLAILFAWPK VSERIPGSLV ALIVGIALVS GFGMQVSTIG DLYAISSDLP 
EFRIPQLNVD LLADQLPNGI TIAILAAIES LLSCVVADSM ISSHHRSNME LVAQGVGNIG 
SVLFGGIPAT GAIARTAANV KNGGRTPVAG MTHALVLLIV LVFFMPYAAL IPMPTIAAIL 
LHVAYNMSGW RNFAHLCKTA SRGAVATLLL TFALTVVFDL VVAIAVGMLI TVVLFMKMVS 
EETEVRGWKY YCDEDSEVTH LRELPESVRV YEINGPMFFG MTDRISDISV KSFTKYLIIR 
MRGVPSLDST GMNALENLYG YCRENGVSLI FSHANEQPMK TMRRAGFVDM VGEDHFRSNI 
DDAIAYARKL LDEEGETASA