Gene Mpe_A0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0966
Symbol
ID	4787112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1027116
End bp	1028207
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	76%
IMG OID	640089528
Product	hypothetical protein
Protein accession	YP_001020163
Protein GI	124266159
COG category	[R] General function prediction only
COG ID	[COG4447] Uncharacterized protein related to plant photosystem II stability/assembly factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.254365
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCCAT CGCGCTCGTT GATCGCGCTC ACCGCGGCGC TGTGCCTGGC GGTCGCCGCC 
GCCGTGCCGG TCGGCGCTGC CGGCACCGCG GCACCGCGCT TCGGCGTGCT GCAGCAGGCC 
GCGCTGCAGT CGCCGCGGGC GCTGTCGGCC ACGATGCTCG CGGTGGCGGC CGCCGGGAAG 
CGACTGGTCG CCGTTGGCGA GCGCGGCATC GTGCTGCTGT CCGACGACGG CGGCGCCCGC 
TGGCGCCAGG CGGCCACCCC CGTGCGGGCC AGCCTGACGG CGGTGCAGTT TGTCGACGAA 
CGGCAGGGCT GGGCCGTCGG CCACCTCGGC GTCGTGCTGC ATTCCGGCGA CGGCGGCGAA 
ACGTGGACCA AGCAGCTCGA CGGGCTGCAG CTGCCGGCGC TGTTCGAGCA GGCGGCACGC 
GCCGACGCGG CCGCCGCGCC GGCCTACCGC GACTACGTCC AGCTGCTTGC CGACGACGGC 
CCCGACAAGC CGCTGCTCGC GCTGCACTTC CAGGACGCTC GGCGCGGCAT CGTCGTCGGC 
GCCTACAACC TCGCGCTCGG CACGGAGGAC GGTGGCGCCA CCTGGACGCC GCTGAGCGCT 
CGACTGCCCA ACCCGCGCTC GCTGCACCTC TACGGCGTCG CGGTCAGCGG CGCCTCGATC 
GTGCTGGCCG GCGAGCAGGG CCTGCTGCTG CGCTCCGACA ACGGCGGCCG TGATTTCGCC 
GCGCTGGAGT CGCCCTACCG GGGCAGCTGG TTCGGCCTGC TGGCCACCCG CGGCGACCGC 
CTGCTGGTCT ACGGACTGCG CGGTGCGGCC TACGTGTCGG CCGACCGCGG CTCGAGCTGG 
ACCCAGGCGA GCACCGAGCT GCCCGTCTCG ATCAGCGGCG CGGCCGAACT GGCCGATGGC 
ACGCTCGTGC TCGGCAGCTC GGCCGGCGAC CTGCTGGTCA GCCGTGACCA GGGGCGCAGC 
TTCCAGCGCC GCGACGGACC GCCCCAGCCG CCGATCGCCG GCCTGGTGCC CACGCAGGAC 
GGCGCCCTCG CACTGGCCGG GCTGCGGGGT CCGCAGCGCG TGGACCTGGC TGCCCCGCCC 
GCCGCCCGCT GA

Protein sequence

MSPSRSLIAL TAALCLAVAA AVPVGAAGTA APRFGVLQQA ALQSPRALSA TMLAVAAAGK 
RLVAVGERGI VLLSDDGGAR WRQAATPVRA SLTAVQFVDE RQGWAVGHLG VVLHSGDGGE 
TWTKQLDGLQ LPALFEQAAR ADAAAAPAYR DYVQLLADDG PDKPLLALHF QDARRGIVVG 
AYNLALGTED GGATWTPLSA RLPNPRSLHL YGVAVSGASI VLAGEQGLLL RSDNGGRDFA 
ALESPYRGSW FGLLATRGDR LLVYGLRGAA YVSADRGSSW TQASTELPVS ISGAAELADG 
TLVLGSSAGD LLVSRDQGRS FQRRDGPPQP PIAGLVPTQD GALALAGLRG PQRVDLAAPP 
AAR