Gene Mpe_A1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1914
Symbol
ID	4786735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2051466
End bp	2052473
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	70%
IMG OID	640090484
Product	UDP-galactose 4-epimerase
Protein accession	YP_001021107
Protein GI	124267103
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.810767
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.343621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATACTCG TGACCGGCGG CACAGGCTTC ATCGGCTCGC ACACCAGCGT GGCGCTGGCG 
AATGCGGGCC ATGACTTCGT CATCCTCGAC AACCTCGCCA ACAGCCAGCG CGACGTGCTC 
GACCGCCTGG CGCCGCTGTG CGGCAAGCGG CCCGCTTTCG TGGAGGGCGA CGTGCGCGAT 
GCCGCCACCC TGGACCGCGT GTTCGCGCAG TACCCGATCC GTGCGGTGAT CCACTTCGCT 
GCGCTGAAGG CGGTGGGCGA ATCGGTGCAG AAGCCGCTGG CCTACTACGA GAACAACATC 
ACCGGCACCC TGCGGCTGCT GGAGGCGATG CGCCGCGCCG CGGTGCACAC GCTGGTGTTC 
TCGTCCTCCG CCACCGTCTA CGGCGACCCG GCGTCGGTAC CGATCCGCGA GGACTTCCCG 
CTATCGGCCA CCAACCCCTA CGGCTGGACC AAGCTGATGG TCGAGCAGAT CCTCGCAGAC 
CTGTCGAAAT CCGAGCCGCA GTGGCGCATC GCGCGGCTGC GCTACTTCAA CCCGGTCGGC 
GCCCATGAGA GCGGCCAGAT CGGCGAAGAC CCCTCGGGCA TCCCGAACAA CCTGATGCCC 
TACGTCGCCC AGGTGGCCGT GGGCCAGCGG CCACAGCTGC AGGTGTTCGG CGGCGACTAC 
CCGACGCCCG ACGGCACCGG CGTGCGCGAC TACATCCACG TGATGGACCT CGCCGAGGGC 
CACGTCGCCG CCCTCGACAG CCTGGCCCGC GAACCCGGCC TGTTGACGGT GAACCTGGGT 
ACCGGCCTGG GCGTCTCGGT GCTGGACATG GTGGCCGCCT TCGAGAAGGC CAGTGGCCGC 
CCGGTGCCCT ACCGCATCGT CGATCGCCGG CCCGGCGACG TGGCGGCCTG CTGGGCCGAC 
CCGGCGCTCG CGCTGCAACG GCTGGGCTGG CGCACCCGCC GCGACCTCGA CCAGATGTGC 
GCCGACGCCT GGCGCTGGCA GAGCAACCGG GCGGCGTGGT CGGCGTGA

Protein sequence

MILVTGGTGF IGSHTSVALA NAGHDFVILD NLANSQRDVL DRLAPLCGKR PAFVEGDVRD 
AATLDRVFAQ YPIRAVIHFA ALKAVGESVQ KPLAYYENNI TGTLRLLEAM RRAAVHTLVF 
SSSATVYGDP ASVPIREDFP LSATNPYGWT KLMVEQILAD LSKSEPQWRI ARLRYFNPVG 
AHESGQIGED PSGIPNNLMP YVAQVAVGQR PQLQVFGGDY PTPDGTGVRD YIHVMDLAEG 
HVAALDSLAR EPGLLTVNLG TGLGVSVLDM VAAFEKASGR PVPYRIVDRR PGDVAACWAD 
PALALQRLGW RTRRDLDQMC ADAWRWQSNR AAWSA