Gene Emin_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0447
Symbol
ID	6262589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	480390
End bp	481340
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	41%
IMG OID	642610917
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001875341
Protein GI	187250859
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00302715
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.000000109049
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGTTTG CCATAACGGG CGGAGCCGGT TTTATAGGCG GCGCGCTTAC AAAAAAATTA 
AATTCTATGG GCCACAGCGT TCGTATATTA ACAAGGGGCT CGGGCCGTAA ATCAGCTGAT 
CCGCAAGTAG AATACATTAC CGCGAAGTAC ACGGATGTTG ATTCTTTAGC TAATGCGTTG 
GAAGGATGTG ACGGCGTTTT TCATTTAGCC GCGGCGATAT TTGCTTTTAA TTATAAAGAA 
TTTGAAGCAG CTAATGTCCT TACCACCCGT AATTTAGTTG ACGCCGCGGC TAAAACAAAC 
AGCGTAAAAT ATTTTACCTA TATGTCAAGC CAGGCGGCGG GAGGATACAG CGCTGATTTG 
GAACATATAA GAACCGAAGA CGATAAACCT AAACCCGCTT CAGATTACGG ACGTACAAAA 
TTAGGGGGGG AAAACGCCGT TGAGTCCCTT CCCGCGCGTA TAAAAAAAAT AATATTTCGC 
CCGCCAATAG TCTATGGTAA AAATGATTCA GGCGTAAGCA AAATAGCCGA TTGGGTAAAA 
ATGGGCATAA TGGTTAACAC CTCTAAGGGG GACGCGTATT TTAACTTTAT TCATGTGGAC 
GATTTGGTTA ATGCAATAGT TAAACCTATT GAAGACGAAT CTTTATTCGG CGGCATTTAC 
TATGTATGCG AAAATAAACC TTATAATTGG AAATTTTTTA TATATTCAAT GGCGGACGCA 
ATGAAAGTCA AACGCCCTTT TATGTTTACG GCGCCATTAT TTGTTTTACA CATTGTGGCG 
TTTTTATATG AAATTATAGC CAAGCTTTTT AATATAGCCC CTGCTTTAAA TTACGATAAA 
GTAAAGGAGG CCTCTATAAA AGGGCATTGG GTAAGCAGCA GTAAAAAATG GATTGACCGC 
ACAGGCCAGC AGTTTACCTC TTTAGAGGAC GGACTTAGAA AAAGTTTTTA G

Protein sequence

MKFAITGGAG FIGGALTKKL NSMGHSVRIL TRGSGRKSAD PQVEYITAKY TDVDSLANAL 
EGCDGVFHLA AAIFAFNYKE FEAANVLTTR NLVDAAAKTN SVKYFTYMSS QAAGGYSADL 
EHIRTEDDKP KPASDYGRTK LGGENAVESL PARIKKIIFR PPIVYGKNDS GVSKIADWVK 
MGIMVNTSKG DAYFNFIHVD DLVNAIVKPI EDESLFGGIY YVCENKPYNW KFFIYSMADA 
MKVKRPFMFT APLFVLHIVA FLYEIIAKLF NIAPALNYDK VKEASIKGHW VSSSKKWIDR 
TGQQFTSLED GLRKSF