Gene Elen_1210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1210
Symbol
ID	8415501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	1451118
End bp	1452452
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	59%
IMG OID	645024173
Product	glycosyl transferase family 2
Protein accession	YP_003181569
Protein GI	257790963
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.47071
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.038027
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGACC AGTTTTTTTC GCAGATCTCG TTCGTTGACA TATTCAACTT CTGCGTGTTT 
CTCACGTTCA CGATCTGCTA CACGTATCAG CTCTACTACG TGTTCGTGGT GCTGACGCGC 
AAGCCCAAGG AGCTCACGGC GAAGAAGAAC CACAAGTTCG CCGCAGTCAT CTCGGCTCGC 
AACGAGAGCG CCGTCATCGG CGACCTCATC CACTCCATCA AGGTGCAGAA CTATCCGTCC 
GAGCTCATCG ACGTGTTCGT CATCGCCGAC AACTGCACGG ACGACACCGC GCGCGTGGCC 
CGCGAGGCAG GCGCCATCGT CTTTCCCCGC AGCAACGACA AGGAAGTTGG CAAGGGCTAC 
GCGCTCGACT ACGGCTTCCA GTGCATTCGC GAGCGCTACG CCGACAAGGG TTACGAGGCG 
TACTTCGTGT TCGACGCCGA CAACGTGCTG GATGTGAACT ACTTCCGCGA GATGAACAAG 
ACCTTCGACA ACGGAGCGAA GGCCTCGACC AGCTATCGAA ACTCCAAGAA CTACGACTCC 
AACTGGATAT CCGCGGGCTA CGCCGTGTGG TTCCTGCGCG AGGCGAAGTT CCTGAACCAG 
GCGCGTCTCA CGCTGAACAC CAGTTGCGCC GTGTCGGGCA CGGGCTTCTT CATAGCCGCC 
GACATCATCG AGAAGAACGG CGGTTGGAAG TGGCACCTGC TCACCGAGGA CATCGAGTTC 
TCTGCGAACA GCATTCTCGA GGGCACGCGC ATCAGCTACA CGCCCACGGC CATCCTCTAC 
GATGAGCAGC CCATCACGTT CCGCGACTCG TGGAACCAGC GCTTCCGCTG GGCGAAGGGC 
TTCTACCAGG TGTTCTGGCA CTACGGTGCC CGCCTGGCGA AAGGCATCGC CGTGAACCCC 
AAGGGCGCGC GCTTCGCTTG CTACGACATG CTCATGACCA TCGCGCCGGG CATGCTGCTT 
ACCATCGTGT CGGTGCTGTT CAACGCCATC ATCGTGTTCC TCAGCCTCAC CGGAGCCATG 
TCCACGGGCA TCATGGTTGC CTCCTCGCTG TCGTCCATCT TGTTCTGCCT GCTGAACTAC 
TTCATCTTCA TGTTCATGTT CGGCGTGCTG ACCACGTTCG TGGAATGGGA CTCCATCCGT 
TCCACCACGG GCAAGAAGGT TCTGTACATG TTCACGTTCC CCGTGTTCAT GATGACCTAT 
ATCCCCATCG CGCTGGTCGC GCTCGTGAAG AAGTGCAACT GGAAGCCCAT CAAGCACAGC 
ATCTCGGTTG ATGTGGCCGA GCTCTCCGAC GCGGCAAGCG CCGCACCCCA AAAGCAGCGT 
GAGCGCACCA TGTAG

Protein sequence

MLDQFFSQIS FVDIFNFCVF LTFTICYTYQ LYYVFVVLTR KPKELTAKKN HKFAAVISAR 
NESAVIGDLI HSIKVQNYPS ELIDVFVIAD NCTDDTARVA REAGAIVFPR SNDKEVGKGY 
ALDYGFQCIR ERYADKGYEA YFVFDADNVL DVNYFREMNK TFDNGAKAST SYRNSKNYDS 
NWISAGYAVW FLREAKFLNQ ARLTLNTSCA VSGTGFFIAA DIIEKNGGWK WHLLTEDIEF 
SANSILEGTR ISYTPTAILY DEQPITFRDS WNQRFRWAKG FYQVFWHYGA RLAKGIAVNP 
KGARFACYDM LMTIAPGMLL TIVSVLFNAI IVFLSLTGAM STGIMVASSL SSILFCLLNY 
FIFMFMFGVL TTFVEWDSIR STTGKKVLYM FTFPVFMMTY IPIALVALVK KCNWKPIKHS 
ISVDVAELSD AASAAPQKQR ERTM