Gene Elen_0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0633
Symbol
ID	8414923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	808457
End bp	809458
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	50%
IMG OID	645023610
Product	glycosyl transferase family 2
Protein accession	YP_003181007
Protein GI	257790401
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.718934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCGC TTGTCAGTGT TATCATCCCT GTTTATAACG TTGAGTCGTA CGTGTCGGAA 
TGCATAGAGA GCGTGATCGC TCAAACTTAT AGCAATATCG AGATCGTTGT AGTAAACGAC 
GGATCGACAG ATGGATCGGG GTTTTCTTGC GATCAATACG CTTGTAGCGA TTCCCGTGTG 
GTTGTGGTGC ACAAAGAGAA CGAAGGGCTG AGTGCTGCCC GAAACGCTGG AATAGCCGTT 
TGTCGGGGTG ATTTCGTGGC CTTCGTTGAC GGCGATGATT TCGTGTCCCC TGTTTTCATT 
GAGACGCTTA TGCATGCTAT CGAAGTGTGC GACTGTGAGA TAGCGGCGAT ACCTTGTGGT 
ACGGCATTCG AGGACGGCTC TTCATGCGAG CTTGTTGCGA AGGCGGCCTT TATTCCCGAC 
GCAAGGGTTA TGGATTCATA TACGGTTCAG AAGTTGATGC TCTATCAAAG GCTCGATACG 
GGAGTTCCAT GGAGGCTTTA TGCTAGACGT ATACTCGGCG ATGCTCCTTT TGCTGTGGGG 
TTGTATTACG AGGACCTGGC AAGCGTTTAC AAGTTCATTC ATGATGTAGA TCGTGTTGCG 
TTGGTTGATT GCAGGGCCTT GTATGCGTAT CGTCTGCGGA AATCCGGAAT CATCAGTCAG 
GCGTACAGTC CGATAAAAGC CTTATCTGCC ATTGAGGTTT CACGACGACT TAGCTCGGAT 
ATGCAGGAAT GGTATCCGGA TCTAGCCGTT GCATCCGCAT CGCGCTGTTT TTCTCTTTGC 
CGGATGGTTT ATGCACAGAT ACCGGTAGAA TACGAGCTTT CCAGTAAGTT CGAGAATGAT 
CGTCGAGCTT TGTGGGGCGA ACTCAAGGAG AGAAGAAAGA TCGTTCTGAG TGATTCTTCG 
GCTCGGAAGA GGGAACGACT TGCTGCAGCC ATTGCCTTGA TCGGCGAAGC TCCGTTTGCT 
CTTTTTTGCC ATGCGTGTAG AAAAGCCGGT CTTCTCAGAT GA

Protein sequence

MNPLVSVIIP VYNVESYVSE CIESVIAQTY SNIEIVVVND GSTDGSGFSC DQYACSDSRV 
VVVHKENEGL SAARNAGIAV CRGDFVAFVD GDDFVSPVFI ETLMHAIEVC DCEIAAIPCG 
TAFEDGSSCE LVAKAAFIPD ARVMDSYTVQ KLMLYQRLDT GVPWRLYARR ILGDAPFAVG 
LYYEDLASVY KFIHDVDRVA LVDCRALYAY RLRKSGIISQ AYSPIKALSA IEVSRRLSSD 
MQEWYPDLAV ASASRCFSLC RMVYAQIPVE YELSSKFEND RRALWGELKE RRKIVLSDSS 
ARKRERLAAA IALIGEAPFA LFCHACRKAG LLR