Gene Mpe_A3209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3209
Symbol
ID	4786548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3411491
End bp	3412618
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	71%
IMG OID	640091782
Product	hypothetical protein
Protein accession	YP_001022397
Protein GI	124268393
COG category
COG ID
TIGRFAM ID	[TIGR02098] MJ0042 family finger-like domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.737407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0103379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGG CCACCCGCTG CACCGCCTGC GGCACGATCT TCCGTGTCGT GCAGGACCAG 
CTCAAGGTCT CGGAAGGCTG GGTGCGCTGC GGCCGCTGCC AGGACACCTT CAACGCGCTC 
GAAGGCCTGT TCGATCTGGA GCGCGAGGCA CCGCCGCAGC GTATCCCGAA GGCCGGCGCT 
ACGCAGTCGG TGGTCGAGGG CATGGCCGAG TTCGTTGCGA GCCATCACCC CGGCAACAGC 
GAACACGGCG CACTGCCGGC CATGCCCGCG ACCCAGGAGC ATGACGCGAT CGAGTCGCGC 
TTCTTCGCGC CGCAGTCCGA CGACAGCCGC TCGGACGAGC ACCCCGATTT CGCCGATGCC 
CGCTTTCCGA GCGAGTTCCC GCCCGACGCC GCGGCACTGG AACCGGACGC GACCGAAGAT 
CCCGTCGATG CGCTGCCGCC AGCCAGCCCC AAGAGCGCGC CGCCGTCCAC GCCATTGCTG 
CAGCGCTGGC GCGACAGCCG TGCCGCGCGA CAGGCGGCCG CGATGAGTTC GCTGCTGGAG 
GCGCCGATCG GGGACGAGGC GGCGATGCCG CCGCCCGCTG CGCCGGCCGT TGCCGGCACC 
CCAGGCTTCC TGCGCCAGGC CGAGGATGCG GCGCGCTGGC GCCGCCCGCG GGTGCGCGCC 
TCGCTCGTCG TGGCTGCGGC ACTGCTGATC GGCACGCTGC TCACCCAGAT CGCTGTGCAG 
TACCGCGACG CCTTCGCGGC ACAATGGCCG CAGGCGCGGC CGACACTGGA AACGCTGTGC 
GAGGTGCTGG ACTGCCGCAT CGAGCCGCTG CGGCGCCTTG CGGCCATCAC CGTCGAATCG 
AGTGGGCTGA CGCAGGTGGA AGGCAGTGAT GCCTACCGGC TGAGCCTGAC GCTGCACAAC 
CGGGGCCAGG TGGATATCGC CCTGCCGTCG GTCGATCTCA GTGTGACCGA CAACAGCGGC 
ACCCTGGTCT CGCGGCGCGC GCTGGCGCCG GCCGATTTCC GCACCGCCAC GGGCGGTTCA 
GTGCCCGGCG TGGCGCTCGC CCCCGGATCG GAAAGTCAGT TGCAAGCACT GCTGACGGCG 
CGCGGCGCAC GCATCAGTGG CTACACGGTC GAGCTGTTCT ATCCCTGA

Protein sequence

MSLATRCTAC GTIFRVVQDQ LKVSEGWVRC GRCQDTFNAL EGLFDLEREA PPQRIPKAGA 
TQSVVEGMAE FVASHHPGNS EHGALPAMPA TQEHDAIESR FFAPQSDDSR SDEHPDFADA 
RFPSEFPPDA AALEPDATED PVDALPPASP KSAPPSTPLL QRWRDSRAAR QAAAMSSLLE 
APIGDEAAMP PPAAPAVAGT PGFLRQAEDA ARWRRPRVRA SLVVAAALLI GTLLTQIAVQ 
YRDAFAAQWP QARPTLETLC EVLDCRIEPL RRLAAITVES SGLTQVEGSD AYRLSLTLHN 
RGQVDIALPS VDLSVTDNSG TLVSRRALAP ADFRTATGGS VPGVALAPGS ESQLQALLTA 
RGARISGYTV ELFYP