Gene Elen_1342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1342
Symbol
ID	8415640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1606887
End bp	1608743
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	58%
IMG OID	645024311
Product	5'-Nucleotidase domain protein
Protein accession	YP_003181700
Protein GI	257791094
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.206839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.550173
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCC GGGCACGCAC CTTTATAGCG GCTTTGACCG TCATGGCCAC GATGGCGGGG 
CTGACCTCAT GCGCGCACTC GCAACCGGAA CCCGGCTACC CCATCTGCAC GGAAAACGAG 
ATCGTGACCT ACGAGCCGAC GGACACGACC AAAACCGTCA TCACCATAGG TCGCTACACC 
ATATTCAATT CGGAGCCGTT GCAAAAGGCT TTGAGCGAGC GCATACCCGA GGCGAGCTTC 
GCCTTCGTCG ACGCCCCCGG CACCAACGAC GTGAGGGCGT ACGTCAAAGA GCAGGCTGAA 
CGCAACGACC TACCCGATAT GGTTTTCAGC GGCATGCGCG TGGGGTCGGG CGAATACGCG 
TACGATCTGT CCGCGGAAGG GTTCACGGGC CGCTACAACC TTTCGGCGCT TGAAAAGCTG 
AGCGTTGACG GAGCTTTGCG GCAACTGCCC ATCAACAGCT CCGTCAAAGG CATTTTCTAC 
AACAAAACGC TTTTCGAGGA GCACGGCTGG GAAATCCCGA CAACCCTTGA TGAGTTCTAC 
GACCTTTGCG ATGCCATCAC AGCCGAAGGC ATCCGTCCCT TCGTCCCTTG CCTGAAATAT 
TCCGTGCAAG ACGTTGGTTT GGGTCTGACC AGCCGAGAAG TGTTCGGCAC GTCGGAAAAG 
CGCGCCCGGT ACGATGACGT GGTCAACAAA GAGGCTTCCT GCGAAGGACT GCTTGAACCG 
TACTACGAGA CGCTCAAGCA GCTGTACGAT CGAGGGATCG TGGTGGAAAG CGATTTCACG 
TCGAGCCTTA CCCAAAACCG TCAGGCCATG TATGCCGGAG AGATTGCGAT GATCCCCAGC 
GATCTGTCGA TGTACAGTCT GTACGAGCAG GAAAAACCCG GTTGCGAGAT CGACTTCATA 
GGGTTTCCGA CCGACACGCC CAACGAGCGA TGGATGCAGA TGTCTCTGGG CGTGAACATG 
ATGGCCTCCC AAAAGTCCAT GGAAGACCCG CAGAAGAAGC GCATCCTGCT TGACGCGCTG 
GACTTCCTGA GCTCGGACGA GGGGCAGGCC GTCCTGTTCG AGTGCTTCAG CGGCATAAGC 
AACGTCAAAT CGTACCAACA GAACATTCGA CCCGAGTTCT GGGACGTGAA GAACTGCCTT 
GACGCAGGCT CCATTTACTT CGCCGACAGA GTCGGTATGA CGTCCGATTT CGAAACCGCA 
TTCGAATGGA TGCGCGGCAA CATGACCATG CAGGAAATCA TAAAGGCGAC CGACGACTTC 
GCACCCTGCA ATCTGTACGA ATCGATGGAG ACCCCCGTCA TCGGAAAAGC GGCCGAGGAT 
TTCACCGTGC TGGAGACCAG CAACCTTATA GCGGACGCCA TGCGCGACGC CTCCGGTGCC 
GACGTAGCGC TGCTGATCAA CAACTACTAT TACAAAGGGA ATTCCGGAAA GCTCTATCAA 
GGGGACATCT CCCTGGCCGA CCGCTTCAAC CTGCGCAGCG TCACGACCGA CGATGTCCTG 
ACGACATACG AGATCAGCGG AACGGATCTG AAAAAGCTCA TGGAGCATCC GAAGATCGGC 
GGCGAAGAGA TCAACGCGAC GTACGCGCTC TCGGGTCTCA AGATGGAATA CACGCCCTGG 
CGCGCCGCCG ACCAGAACGT GCTGAGCCTG ACGTTGCCCG ACGGGACCGA GATCTCCGAC 
GACGCGCAGT ACACGGTGGC CGCCTGGGCC GGGTCGATCG ACGAGTCGTA CATCGGATCC 
GTCTTGGAAG CGCATGCGGA CGCGGGGACG AACGTCGATT TGATGACCGC GTACTTGGGC 
CGCGTTGGCG AGGTTTCCCC TGCAAAAGAT GGGCGTATCA CGCTGATCTG GGACTGA

Protein sequence

MKTRARTFIA ALTVMATMAG LTSCAHSQPE PGYPICTENE IVTYEPTDTT KTVITIGRYT 
IFNSEPLQKA LSERIPEASF AFVDAPGTND VRAYVKEQAE RNDLPDMVFS GMRVGSGEYA 
YDLSAEGFTG RYNLSALEKL SVDGALRQLP INSSVKGIFY NKTLFEEHGW EIPTTLDEFY 
DLCDAITAEG IRPFVPCLKY SVQDVGLGLT SREVFGTSEK RARYDDVVNK EASCEGLLEP 
YYETLKQLYD RGIVVESDFT SSLTQNRQAM YAGEIAMIPS DLSMYSLYEQ EKPGCEIDFI 
GFPTDTPNER WMQMSLGVNM MASQKSMEDP QKKRILLDAL DFLSSDEGQA VLFECFSGIS 
NVKSYQQNIR PEFWDVKNCL DAGSIYFADR VGMTSDFETA FEWMRGNMTM QEIIKATDDF 
APCNLYESME TPVIGKAAED FTVLETSNLI ADAMRDASGA DVALLINNYY YKGNSGKLYQ 
GDISLADRFN LRSVTTDDVL TTYEISGTDL KKLMEHPKIG GEEINATYAL SGLKMEYTPW 
RAADQNVLSL TLPDGTEISD DAQYTVAAWA GSIDESYIGS VLEAHADAGT NVDLMTAYLG 
RVGEVSPAKD GRITLIWD