Gene Mpe_A2600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2600
Symbol
ID	4787037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2773034
End bp	2774083
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	65%
IMG OID	640091171
Product	TIS1021-transposase protein
Protein accession	YP_001021789
Protein GI	124267785
COG category	[L] Replication, recombination and repair
COG ID	[COG3039] Transposase and inactivated derivatives, IS5 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.90039
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTGCG GCGAATTCAG CGGCGATGAT GCTGCCATGA AGCAGACGAG TTTTGCCACT 
GCCGAGTACG CCGGCAAGAA GCGCCAGACG CGCCGGGAGC GCTTCCTGGC CGAGATGAAC 
GTGGTGGTTC CGTGGGCGCG GCTTGAGGCG CTGATCGAGC CGCACTACCC GAAGAGCGGC 
AAGGTGGGCC GACCGCCGAT TGGCGTGCCG CGGATGCTGC GCATGTACTT CCTGCAGCAG 
TGGTACACGC TGGCCGACGA GGCACTGGAA GACGCGCTGT ACGACAGCCA GGCCATGCGC 
GAGTTCATCG GCATCGACCT TGGGCGGGAG AACGTACCCG ACGCCACAAC GCTGCTGAAG 
TTCCGCCGCC TGCTCGAGCA GCACGACTTG ACGTCGGCCA TCCTGGCCGA GGTCAACGCG 
CACCTCACCG AGCGTGGGCT GCTGATGCGC CAGGGCACGG TGGTGGACGC CACCATCATT 
GCCGCGCCAA GTTCGACGAA GAACGAGGAC GGCAAGCGCG ACCCCGAGAT GCACCAGACC 
AAGAAGGGGA ACCAGTGGCA CTTCGGGATG AAGATGCACT CGGGCGTGGA TGCCGAGTCG 
GGTCTGATCC ACAGCGTGGT CTGCACCGCG GCCAACGAGG CTGACGTGGC GCACGCGCAC 
GAACTGCTGC ATGGCCAGGA GAGCCAAGTT CACGGCGACA GCGGCTACAC CGGCATCCAG 
AGGCGAGACG AGATCACGAC GGCGCAGGAA GAGGGCAGGC TGCGCCAGGA CATGGATTGG 
CGTATCGCCA TGAAGCGCGG CCAACTCAAG GCCATGCCCG AAGGGCCGGC CAAGGCGATG 
CACGAGTGGT TCGAACGGCG CAAGGCTCAG GTGCGGGCCA TCGTCGAACA CCCGTTCCAC 
GTCATCAAGA ACCTGTTCGG CTACCGCAAG GTCAGCTACC GCGGGATCTC CAAGAACGAA 
GCTCGCGCGA AGGCGCACGC TGCGCTGGCC AACTTGTACA TCGCCCGGCG CCGATTGCTG 
GCCCAAGGCC TCAGTGCGTC TGCTGCATGA

Protein sequence

MACGEFSGDD AAMKQTSFAT AEYAGKKRQT RRERFLAEMN VVVPWARLEA LIEPHYPKSG 
KVGRPPIGVP RMLRMYFLQQ WYTLADEALE DALYDSQAMR EFIGIDLGRE NVPDATTLLK 
FRRLLEQHDL TSAILAEVNA HLTERGLLMR QGTVVDATII AAPSSTKNED GKRDPEMHQT 
KKGNQWHFGM KMHSGVDAES GLIHSVVCTA ANEADVAHAH ELLHGQESQV HGDSGYTGIQ 
RRDEITTAQE EGRLRQDMDW RIAMKRGQLK AMPEGPAKAM HEWFERRKAQ VRAIVEHPFH 
VIKNLFGYRK VSYRGISKNE ARAKAHAALA NLYIARRRLL AQGLSASAA