Gene Mpe_A2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2009
Symbol
ID	4783796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2151800
End bp	2152897
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	67%
IMG OID	640090579
Product	hypothetical protein
Protein accession	YP_001021202
Protein GI	124267198
COG category	[R] General function prediction only
COG ID	[COG1485] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.314691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCC GCCAACTGTT CGGTGAGACG CTTTCCGAGC GCGGCTACCG GGCCGACGAG 
GCGCAGTTGC GCGCGCTCGA CGCGCTGGAG CGCTGCGAGA ACGAGTGGAT CGACTACAAG 
GCACGCCGCA GCAATGCGGT GAGCAAGCTG CTGCGCCGGC CACCGATTCC TCGCGGCGTC 
TACATGTACG GCGGTGTCGG GCGCGGCAAG AGCTTCCTGA TGGACTGCTT CTTCCAGTCG 
GTGCCGCTGG TGCGCAAGAC GCGGCTGCAC TTCCACGAGT TCATGCGCGA GGTGCATCGC 
GAATTGCAGG AGCTCAAGGG CACGGCCGAC CCGCTGGACG AACTGGGCAG CCGCATCGCG 
CGGCGCTTCC GGTTGATCTG CTTCGACGAG TTCCACGTCG CCGACGTGAC CGACGCGATG 
ATCCTGCACC GCCTGCTGGC GGCACTGTTT GCCAACCGCG TCAGCATCGT CACGACGTCC 
AACTTCCACC CCGACGCGCT CTATCCCAAT GGCCTGCATC GCGACCGGAT CCTGCCGGCG 
ATCGAACTGC TCAAGGACAG GCTGGAGGTG ATCAATGTCG ACGCCGGGGT CGACTACCGC 
CAGCGCACGC TGGAGGACGT GGCGCTCTAC CACACACCGC TCGGACCGGA GGCCGACGGA 
GCGCTGACCG AGACCTTCGA GCGCCTCGCC GAGGCCAAGG ACGAGGATCC GGTGCTGAAC 
ATCGAGCAGC GGACGATCCG TGCGCGCCGG CGCGCCGGGG GGGTGGTGTG GTTCGACTTC 
AAGACCCTGT GCGGCGGCCC GCGCTCGCAG AACGACTACC TCGAACTGGC CTCGCAGTTC 
CATACCGTGC TGCTGTCCGA CGTGCCCGAG ATGCCGCCCC GGCTGGCGTC CGAGGCGCGG 
CGCTTCACGT GGCTGGTCGA CGTGCTCTAC GATCGGCGCG TGAAACTCGT GATATCCGCC 
GCCGTGCCTC CCGAACAGCT CTACACCGAC GGGCCGCTGG CCCATGAATT TCCGCGCACC 
GTGTCTCGCT TGACCGAGAT GCAGTCGGCC GAGTTTCTGG CGCTGTCGCG GCGAGATGTC 
GATACGAGCT TGACGTGA

Protein sequence

MTVRQLFGET LSERGYRADE AQLRALDALE RCENEWIDYK ARRSNAVSKL LRRPPIPRGV 
YMYGGVGRGK SFLMDCFFQS VPLVRKTRLH FHEFMREVHR ELQELKGTAD PLDELGSRIA 
RRFRLICFDE FHVADVTDAM ILHRLLAALF ANRVSIVTTS NFHPDALYPN GLHRDRILPA 
IELLKDRLEV INVDAGVDYR QRTLEDVALY HTPLGPEADG ALTETFERLA EAKDEDPVLN 
IEQRTIRARR RAGGVVWFDF KTLCGGPRSQ NDYLELASQF HTVLLSDVPE MPPRLASEAR 
RFTWLVDVLY DRRVKLVISA AVPPEQLYTD GPLAHEFPRT VSRLTEMQSA EFLALSRRDV 
DTSLT