Gene Emin_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1040
Symbol
ID	6262903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1133330
End bp	1134256
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	42%
IMG OID	642611520
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001875930
Protein GI	187251448
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.56373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGACA GAAAATATAC ATGGGCTATA ACGGGCGGAG CGGGGTTTAT AGGCTCGCAC 
ACAGTACGTG AACTTTTAAA AAACGGCCAA AATGTTATTG TCATAGATAA TACCAAACAC 
ATAGGCAAAA CCCCTTTAGC GCCCTTTGCC GACCGGGTTA CCTTTTTAAA CTTTGACGTA 
AGAAATTTTG AAAATATCCT TAACGCTTTA AAAAATGTTG ATTATGTTAT CCATTTAGCG 
GCCTTGGTGT CGGTAGCGGA ATCAATGCAC AACCCTCAGT TATCGCTTGA AATAAATATA 
CACGGCACAG CCAATGTTTT GGAAGCCGCC AGACTAAACA AAGTTAAACG TTTTATTTTC 
GCGTCATCCA GCGCGGTATA CGGCAATAAC CCGGACGCGC CTTACCAGGA AACAGCCCAA 
ACAAACATTC AATCCCCATA TGCTTTAGGC AAACTGGCGG GGGACGAGCT TTGCCAAATG 
TACACTGATT TATACGGGCT TGAAACTGTT ATATTAAGAT ACTTTAACGT CTTTGGCCCC 
GGGCAGGACG CCGACTCACC TTATTCGGCC GTTATAGCTA AATTTATAGC TTTAGCTAAA 
GAAAATAAGT CTTATAATAT CCAGTGGGAC GGCACCCAAA CACGTGATTT TATTTATGTG 
TCGGACGTGG CCAACGCCAA CCTGCTTGCC GCCGCTAAAG CTAAACCCGG CGAAATTTAC 
AATGTAGCCA GCGGACAAAC AACCACTTTA CTAAAACTTA CCGAAATGAT TGACGCCGTC 
AGCGGCGTTA AAAATAAAAA AGAATTCTCC CCCAAAAGAG AAGGCGACGT AAAACATTCC 
GCAGCGGTTA TTTCTAAAAT AGAAAAACTT GGTTTTAAGA CTACGATATC TTTGCAAGAA 
GGCCTTAAAC TTATGTGGAA TAAATAA

Protein sequence

MFDRKYTWAI TGGAGFIGSH TVRELLKNGQ NVIVIDNTKH IGKTPLAPFA DRVTFLNFDV 
RNFENILNAL KNVDYVIHLA ALVSVAESMH NPQLSLEINI HGTANVLEAA RLNKVKRFIF 
ASSSAVYGNN PDAPYQETAQ TNIQSPYALG KLAGDELCQM YTDLYGLETV ILRYFNVFGP 
GQDADSPYSA VIAKFIALAK ENKSYNIQWD GTQTRDFIYV SDVANANLLA AAKAKPGEIY 
NVASGQTTTL LKLTEMIDAV SGVKNKKEFS PKREGDVKHS AAVISKIEKL GFKTTISLQE 
GLKLMWNK