Gene Mpe_A1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1030
Symbol
ID	4785633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1100292
End bp	1101413
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	74%
IMG OID	640089593
Product	hypothetical protein
Protein accession	YP_001020227
Protein GI	124266223
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.950675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGG TCGATGCGGT GGTTGTCGGG GCCGGGGTCG TGGGGCTGGC GGTCGGTCGC 
GCGCTGGCGC GGCGCGGCTT CGAGACCGTG GTGCTTGAAA GCGAGACCGC GATCGGCACC 
GTCACCAGCG CGCGCAACAG CGAGGTGATC CATGCCGGCC TCTACTACCC CTCCGGTTCG 
CTGAAGGCGC GGCTGTGCGT GGCCGGCAAG GCGGCGCTCT ACGCCTACTG CGCCGAGCGC 
GGCATCGCGC ACCGGCGCTG CGGCAAGCTG ATCGTCGCGA CCGGGCCGAC GCAGCATGCG 
GCGCTGCACG CGCTGAGCCG GCGTGCGGCC GACAACGGCG TCGACGACCT GCAACTCCTG 
ACGCCGGACG CTGCGCGTGC GCTCGAACCC GCGCTCGCCT GCAGCGAGGC ACTGCTGTCG 
CCGTCGACCG GCATCGTCGA CAGCCACGGC CTGATGCTCG CGCTGCAGGG CGACCTGGAG 
TCGGCCGGCG GCGCGGTGGC GCTGGCCTCG CGCGTCGAGC GCATCGAGGT CGGGCGACCG 
CACCGTGTGC AGGCAGCCGG CATGACGCTG GGCGCGCGCA TCGTCGTCAA TGCCGCCGGG 
CTGTGGGCGC CGGCGCTCGC ACGGCGCACC GAGGGGCTGG CGCCGGCCTT CCAGCCGCCG 
GGCCGGTTCG CGAAGGGCAG CTACTTCGCG TTGCCGGGCC GGGCGCCGTT CTCGCATCTC 
ATCTACCCGA TGCCGGAGGT GGCCGGCCTC GGCGTCCACC TGACGCTCGA TCTCGGCGGC 
CAGGCGCGCT TCGGGCCCGA TGTGGAATGG GTCGAGCCCG GTCCCGCCGC CGCGGGCGGT 
GACGGCACGC TCGACTACCG CGTCGACGTT CGGCGCGCCG ATGGCTTCTA TGCGGAGATC 
CGCCGCTACT GGCCGGCGCT TCCCGACGGC GCGCTGCAGC CGGCCTACAG CGGCGTGCGA 
CCCAAGCTGT CGGGCCCGGG CGAGCCGGCG GCCGACTTCC GCATCGACGG CCCGGCCGAG 
CACGGCATCG AGGGCCTGGT GAACCTGCTC GGCATCGAGT CGCCGGGCCT GACGGCCAGC 
CTCGCGCTGG CCGACGAGAC GCTGCGGCGC CTGGCTGCGT GA

Protein sequence

MDQVDAVVVG AGVVGLAVGR ALARRGFETV VLESETAIGT VTSARNSEVI HAGLYYPSGS 
LKARLCVAGK AALYAYCAER GIAHRRCGKL IVATGPTQHA ALHALSRRAA DNGVDDLQLL 
TPDAARALEP ALACSEALLS PSTGIVDSHG LMLALQGDLE SAGGAVALAS RVERIEVGRP 
HRVQAAGMTL GARIVVNAAG LWAPALARRT EGLAPAFQPP GRFAKGSYFA LPGRAPFSHL 
IYPMPEVAGL GVHLTLDLGG QARFGPDVEW VEPGPAAAGG DGTLDYRVDV RRADGFYAEI 
RRYWPALPDG ALQPAYSGVR PKLSGPGEPA ADFRIDGPAE HGIEGLVNLL GIESPGLTAS 
LALADETLRR LAA