Gene Mpe_A3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3478
Symbol
ID	4786296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3689009
End bp	3690085
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	71%
IMG OID	640092058
Product	nitrilase
Protein accession	YP_001022666
Protein GI	124268662
COG category	[R] General function prediction only
COG ID	[COG0388] Predicted amidohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.42672
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCCCC CTCGCACCGT CCGCGCTGCC GCGGTCCAGA TCGCGCCCGA TCTCGAGCGG 
CCCGAGGGCA CGCTCGAGCG CGTGCTCGCG GCGATCGACG AGGCGGCCGG GCGCGGCGCG 
GGGATCGTGG TGTTCCCCGA AACCTTCGTG CCCTACTACC CCTACTTCTC GTTCGTGCTG 
CCGCCGGTGC TGCAGGGCGC GCCGCACCTG CGGCTGATGG AGCACGCGGT GGTGGTGCCC 
GGGCCGGTCA CGCAGGCGGT CGGCGAGCGG GCCCGCGCGC GCGGCATCGT CGTCGTGCTC 
GGCGTCAACG AGCGAGACCA CGGCAGCCTC TACAACACCC AGCTGGTGTT CGACGCCGAC 
GGTGCGCTGA TCCTGAAGCG CCGCAAGATC ACCCCGACCT ATCACGAGCG CATGGTCTGG 
GGCCAGGGCG ACGGCGCCGG GCTGAAGGTG GTGGACAGCG CGGTCGGCCG CGTCGGCGCG 
CTGGCCTGCT GGGAGCACTA CAACCCGCTG GCGCGCTACG CGCTGATGAC GCAGCACGAG 
GAGATCCACT GCGCGCAGTT TCCCGGCTCG ATGGTCGGGC AGATCTTCGC CGACCAGATG 
GCGGTGACGA TTCGCCACCA CGCGCTGGAG TCGGGCTGCT TCGTCGTCAA CGCCACCGGC 
TGGCTGACCG ACGCGCAGAT CGCCGCGATC ACGCCCGACG CCGGCCTGCA GAAGGCGCTG 
CGCGGCGGCT GCCACACCGC CATCGTCTCG CCCGAGGGCA AGGACCTGTG CACGCCGCTG 
ACCGAGGGCG AGGGCATCGT CTATGCCGAC CTCGACATGG CGCTGATCGC CAAGCGCAAA 
CGCATGATGG ACTCGGTGGG CCACTACGCG CGCCCCGAGC TGCTGAGCCT CCTGATCGAC 
GACCGCCCGG CCACGACCTC GACGTCGATG ACCGCGGCCG CCCTTGCCCC TGCCGTTCCC 
GCGACCTTCC GGAGTTCCTC CCATGAGCAC GCCGCCCCTC AGCCCCGCCA CGCCCCTGTC 
GCCGGAGAGC CGCCGGCTGA TGACCGAGCT GCAGTCCTTC GGGTTGCGGC TGGCTGA

Protein sequence

MSPPRTVRAA AVQIAPDLER PEGTLERVLA AIDEAAGRGA GIVVFPETFV PYYPYFSFVL 
PPVLQGAPHL RLMEHAVVVP GPVTQAVGER ARARGIVVVL GVNERDHGSL YNTQLVFDAD 
GALILKRRKI TPTYHERMVW GQGDGAGLKV VDSAVGRVGA LACWEHYNPL ARYALMTQHE 
EIHCAQFPGS MVGQIFADQM AVTIRHHALE SGCFVVNATG WLTDAQIAAI TPDAGLQKAL 
RGGCHTAIVS PEGKDLCTPL TEGEGIVYAD LDMALIAKRK RMMDSVGHYA RPELLSLLID 
DRPATTSTSM TAAALAPAVP ATFRSSSHEH AAPQPRHAPV AGEPPADDRA AVLRVAAG