Gene Emin_1520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1520
Symbol
ID	6263585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1611523
End bp	1612461
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	41%
IMG OID	642612007
Product	ADP-L-glycero-D-manno-heptose-6-epimerase
Protein accession	YP_001876404
Protein GI	187251922
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02197] ADP-L-glycero-D-manno-heptose-6-epimerase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00376715
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	3.69674e-16
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATAAAA AAAGATATTT AGTAACAGGC GGCGCGGGGT TTATCGGAAG CAATATCGCT 
TTTGAATTAC AAAACCAGGG CCATGAAGTA ACAATAATGG ACGATTTTTC CTCAGGCAAT 
TTTAAAAACC TTTTAGGTTT TAAAGGGGAT GTAACAGCGG CCGATGTTTT TAAATTCATG 
CCGGAAGATG TTTACTTTGA CGCTATTTTC CATGAAGCAG CCATTACGGA CACAACTATC 
CATGACCAAA AATTAATGAT GGAAATGAAT GTTGAGGCGT TTAAAAACGT TCTTCATTTC 
GCGGCCAGCA ATGAAATTAA AAGGGTTGTT TATGCCTCTT CCGCGGGCAC ATACGGACAA 
AACCCCTGCC CTATGACGGA GACGCAGGTT CCCATGCCGG AAAACGTTTA CGGCTTTTCC 
AAAGCTGTTA TGGATAATGT CGCGCGCGAG TTTGCCTCGG ACCACCAGGA TATGGTTATT 
GTAGGCCTTC GCTATTTTAA TGTTTACGGC CCCGGTGAAT ATTACAAAGG ACACACAGCA 
AGCATGATAT ACCAGCTTTA TAATCAAATG AAAGCGGGTA AAAACCCAAA AATCTTTAAA 
ATGGGTGAAC AACAAAGAGA TTTCGTTTAC ATTAAAGATG TTGTAAAAGC TAACCTTTGC 
GCGCTTACGG CTAAAGAAAG CTGTGTAGTA AACGTAGGGT TCGGCACGCC CAGAACATAT 
AACGACGTTG TTGCCTGTTT AAATAAAGAA ACGGGCCTTA ATTTACAGCC CGATTATATT 
GACAACCCGT ATCCTTTTTT CCAATTAAAA ACCGAAGCGG ATTTAACTTT GGCTAACCAG 
AAAATAGGAT ATACACCTGA TTACAACCTT GAAAAAGGCA TTGAGGAATA TGTGCAGATT 
TTAAATAAAA GACCTGTGCA GCCTGCGGTA AAGAAATAG

Protein sequence

MDKKRYLVTG GAGFIGSNIA FELQNQGHEV TIMDDFSSGN FKNLLGFKGD VTAADVFKFM 
PEDVYFDAIF HEAAITDTTI HDQKLMMEMN VEAFKNVLHF AASNEIKRVV YASSAGTYGQ 
NPCPMTETQV PMPENVYGFS KAVMDNVARE FASDHQDMVI VGLRYFNVYG PGEYYKGHTA 
SMIYQLYNQM KAGKNPKIFK MGEQQRDFVY IKDVVKANLC ALTAKESCVV NVGFGTPRTY 
NDVVACLNKE TGLNLQPDYI DNPYPFFQLK TEADLTLANQ KIGYTPDYNL EKGIEEYVQI 
LNKRPVQPAV KK