Gene Mpe_A1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1999
Symbol
ID	4783786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2141251
End bp	2142435
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	68%
IMG OID	640090569
Product	hypothetical protein
Protein accession	YP_001021192
Protein GI	124267188
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.175204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGG CCAACCTGCT CGAATTCGAT CTCGACGCGC TGGCCGCTTT CTGCGAGCAG 
CTCGGCGAGA AGCGTTTTCG CGCCACTCAG CTGTTCCGCT GGATCCACCA GAAGGGCCAG 
AGCGACTTCG CTCAGATGTC CGATCTGGCG AAGTCGCTGC GCGAGAAGCT GGCGGGGCGG 
GCGGTGGTCC GGCCACTCGC AGTGCTGAGC GAGCACGTGT CGGCCGACGG CACGGTCAAG 
TGGCTGTTCG ACGTCGGCGG CGGCAATGCC GTCGAGACGG TGTTCATCCC CGAGAACGAT 
CGCGGCACGT TGTGCATCTC GTCGCAGGCC GGTTGCGCGG TCGGTTGCCG CTTCTGCTCG 
ACCGGTCACC AGGGCTTCAG TCGCAACCTG TCGACCGGCG AGATCGTTGC CCAGCTCTGG 
CATGCCGAGC ACCAGCTGCG CGCACGGCTG GGCACGACCG AGCGCGTCAT CAGCAACGTC 
GTGATGATGG GCATGGGTGA GCCGCTGCAG AACTACGCCG CGCTGTTGCC GGCGCTGCGC 
GTGATGCTCG ACGATCACGG CTACGGCCTG TCGCGTCGCC GTGTCACGGT ATCGACCTCC 
GGTGTGGTGC CGATGATCGA CCGCCTGCGC GAGGACTGTC CGGTGGCTCT GGCAGTGTCG 
CTGCATGCGC CGACCGACGC GCTGCGCGAC GATCTCGTGC CGCTCAACCG CAAGTACCCG 
ATCGCAGAGC TGCTCGAGGC CTGCCAGCGC TACCTCGAGG CGGCGCCGCG CGACTTCATC 
ACCTTCGAGT ACTGCATGCT CGACGGCGTC AACGACAGTG AGGCGCAGGC GCGCGAACTG 
TTGCGCCTGG TGGGCGAACG CGGGCCGGTG GGGCGCGTGC CCTGCAAGAT CAACCTCATC 
CCGTTCAACC CGTTCCCGGC CTCGGGGCTG ACGCGTTCGT CAGTGGCGCG CGTGCAGGCC 
TTCGCGCAGC TGCTGGTCGA CGGGGGTCTG GTCACCACGG TGCGACGGAC TCGCGGCGAT 
GACATCGACG CCGCCTGCGG CCAACTGGCC GGCGAGGTAC AGGACCGCAC CAATGCGCAG 
GCACGGATGC GGCGTGCGCC GATCGCCATC CGGCCGATCG ACAGCGCGGT GCAGCGCCGG 
GCCGACGCTG CACCATCAGG TTCAGCCACG GAGACGACAC GATGA

Protein sequence

MTAANLLEFD LDALAAFCEQ LGEKRFRATQ LFRWIHQKGQ SDFAQMSDLA KSLREKLAGR 
AVVRPLAVLS EHVSADGTVK WLFDVGGGNA VETVFIPEND RGTLCISSQA GCAVGCRFCS 
TGHQGFSRNL STGEIVAQLW HAEHQLRARL GTTERVISNV VMMGMGEPLQ NYAALLPALR 
VMLDDHGYGL SRRRVTVSTS GVVPMIDRLR EDCPVALAVS LHAPTDALRD DLVPLNRKYP 
IAELLEACQR YLEAAPRDFI TFEYCMLDGV NDSEAQAREL LRLVGERGPV GRVPCKINLI 
PFNPFPASGL TRSSVARVQA FAQLLVDGGL VTTVRRTRGD DIDAACGQLA GEVQDRTNAQ 
ARMRRAPIAI RPIDSAVQRR ADAAPSGSAT ETTR