Gene Mpe_A3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3107
Symbol
ID	4786680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3306727
End bp	3307839
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	66%
IMG OID	640091678
Product	3-dehydroquinate synthase
Protein accession	YP_001022295
Protein GI	124268291
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.117886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCGA TCTCTGTGAC TCCTCTCTCC GGCATCGAGA CCATCGATAT CGCCCTCGGC 
GAGCGGAGCT ATCCCATACG CATCGGCTCC GGCTTGCTGC GCGCGCCCGA AAGTTTTGCA 
GGCGTCCCGC GCAGCCCGTT GGCCGTCATC GTCAGCAACA CCACGGTGGC GCCGCTCTAT 
GCGCAGTCCC TGCGGGACGC TCTGCGCGGG AGGCACGCGC AGGTCGAGCT CATCACGTTG 
CCCGACGGCG AAAGCCACAA GGATTGGGCC GCGCTGAACC TGATCTTCGA CGCGCTGCTG 
GCCAGAGGCG CCGATCGGAA GACGATCCTC TATGCGCTGG GCGGTGGGGT GGTCGGCGAC 
ATGACCGGCT TCGCCGCAGC CAGCTACATG CGCGGGGTGC CCTTCGTTCA GGTCCCCACC 
ACGCTGCTGG CGCAGGTCGA TTCCTCCGTG GGTGGCAAGA CGGGTATCAA CCACCCGCGC 
GGTAAGAACA TGATCGGCGC GTTCCATCAG CCGGTCTGCG TCGTCGTCGA TCTGGAGACG 
CTGAGCACGC TGCCGATGCG GGAGTTGCGC GCCGGCCTGG CCGAAGTCAT CAAGTACGGG 
CCGATCGCCG ATGCGAGCTT CCTGGGTTGG GTCGAAGCCA ACCTGGATGC ATTGCTTGCT 
CGCGATGTGG CCACCCTGCG CCATGCCGTG CGACGGTCGT GCGAGATCAA GGCGGCCGTC 
GTCGGTCAGG ACGAGCGCGA GGCCGGCTTG CGGGCCATTC TCAATTTCGG CCATACCTTC 
GGTCATGCGA TCGAGGCAGG TCTGGGTTAC GGAGAGTGGC TCCATGGTGA GGCTGTCGGT 
TGCGGCATGG CGATGGCAGC CGAAACCTCG GCGCGACTGG GCCTGCTGCC CGAGGGGGAC 
GCGGAGCGCC TGATCCGGCT CATCGATCGT GCGGGTTTGC CGGTGAAGGG GCCGGACCTG 
GGGGCGGATC GCTATCTCGA GCTCATGCGC CTCGACAAGA AGGCGGAAGC CGGCGAAATC 
AAGTTCGTGC TGCTCGACGC CATCGGGCAT GCCGTGCTGC GCAGCGTGCC GGATGCAACC 
TTGCGTCAGG TCCTCGCTTC GCGCTGTACG TGA

Protein sequence

MSSISVTPLS GIETIDIALG ERSYPIRIGS GLLRAPESFA GVPRSPLAVI VSNTTVAPLY 
AQSLRDALRG RHAQVELITL PDGESHKDWA ALNLIFDALL ARGADRKTIL YALGGGVVGD 
MTGFAAASYM RGVPFVQVPT TLLAQVDSSV GGKTGINHPR GKNMIGAFHQ PVCVVVDLET 
LSTLPMRELR AGLAEVIKYG PIADASFLGW VEANLDALLA RDVATLRHAV RRSCEIKAAV 
VGQDEREAGL RAILNFGHTF GHAIEAGLGY GEWLHGEAVG CGMAMAAETS ARLGLLPEGD 
AERLIRLIDR AGLPVKGPDL GADRYLELMR LDKKAEAGEI KFVLLDAIGH AVLRSVPDAT 
LRQVLASRCT