Gene Mpe_B0545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_B0545
Symbol
ID	4787388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008826
Strand	+
Start bp	495214
End bp	496236
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	65%
IMG OID	640092972
Product	carbonic anhydrase
Protein accession	YP_001023550
Protein GI	124263080
COG category	[R] General function prediction only
COG ID	[COG0663] Carbonic anhydrases/acetyltransferases, isoleucine patch superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.421322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00175013
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTCTTG GGCTCAACCT GATTGCGTAC CAGGGTACGC TCCCCGCGTT CGCCTCTCAG 
CCCGCGGCGG CGCTCCCTGG TCACGCCGTC GTAGGCCGCG TCTCGCTGGG TCGCAACGCA 
TGGCTGGGCG CTGGCGCGGT CATCCGTGCC GACGGACACT TCGTGCGGAT CGGTGACGAC 
TTGCACATGG GCCGAGGCGC GACAATCCAT ATCGCCCACG AGGTCTATCC AACCTTGGTT 
GGCGCTAGGG TGTCCATCGG CGCTGATGCG GTCGTGCATG CCTGCACCGT GGGTAACGAT 
GTCGTCGTCG AGCGGGGATC CGTGATCCTT GACGGTGCGA AGGTCGGTGA CGGTGCCGTC 
GTCGAGGCTG GGAGCATCGT CTATCCGCGA AGCACGCTGG AGCCTGGCAT GTTGTACGCG 
GGTCGGCCCG CCAAGCTGTT ACGGGCGCTT GGCCTGCATG AAGTGCAGAG CCGAGCCGAA 
CTGCAGCGAG CGCGCAATGA GGCATGCGAC GTCCGCTGGA CGTGCCAACC GATTCCGACC 
GGAGCTGCGC CCGATTCATT CGTCGCCGGC ACCTGCGATC TCTCGGGCAG CGTTCACTTG 
GCCGAGGGCG CCAGCGTGTG GTTTGGCTGC CGTCTGGATG GTCGCGAGGG GCCGATTTCG 
ATCGGCAGAC TCTGCAACGT GCAGGACAAC TCGGTGCTTC GGGCCGGATC CCTGGGGATG 
TCGTTGGGCG ATCAAACCAC GGTCGGACAC AACGTCCAGC TGGTGGACTG CAGCGTCGGT 
TCCCGCTGCC TCGTCGGCAT CGGCAGTAGC ATCGCACCCG GCACGCGCAT CGATGACGAC 
ACCTTCGTCG CTGGCGGCAG CGTCACCGAA CCCGGCCAGC ACCTGACGGG CGGACGGGTT 
TGGGGCGGCG ATCCTGCACG GCCTATCGGC GAGATGAACG AGGCCAAGCG GACGGCGATC 
TCGAACATCG CGATCGTTTA CGAAAGTTAT GCGCGAGCGT TGCATGCCAG CGTACTAGGC 
TGA

Protein sequence

MTLGLNLIAY QGTLPAFASQ PAAALPGHAV VGRVSLGRNA WLGAGAVIRA DGHFVRIGDD 
LHMGRGATIH IAHEVYPTLV GARVSIGADA VVHACTVGND VVVERGSVIL DGAKVGDGAV 
VEAGSIVYPR STLEPGMLYA GRPAKLLRAL GLHEVQSRAE LQRARNEACD VRWTCQPIPT 
GAAPDSFVAG TCDLSGSVHL AEGASVWFGC RLDGREGPIS IGRLCNVQDN SVLRAGSLGM 
SLGDQTTVGH NVQLVDCSVG SRCLVGIGSS IAPGTRIDDD TFVAGGSVTE PGQHLTGGRV 
WGGDPARPIG EMNEAKRTAI SNIAIVYESY ARALHASVLG