Gene Mpe_A3365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3365
Symbol
ID	4786407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3575486
End bp	3576604
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	65%
IMG OID	640091939
Product	hypothetical protein
Protein accession	YP_001022553
Protein GI	124268549
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.283378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA AGACCGCCCC GCAACGTCGT CGCTTCCTCA AGAAGGCTTC CGCCGGTGCC 
GTCGGCGCCA CCGCGATGGC CGCCCCGATG GTGTCGGTCG CGCAGACCAC CGCGCTGCGC 
TTCCAGAGCA CCTGGCCCTC GAAGGACATC TTCCACGAGT ACGCGCAGGA CTTCGCCACC 
AAGGTCAACA ACATGGCCGG TGGCCGGCTG AAGATCGAGG TGCTGCCGGC GGGTTCGGTG 
GTGCCGGCCT TCCAGCTGCT GGAAGCTGTC AACAAGGGCA CGCTCGACGG CGGTCACGGC 
GTCGTGGCCT ACCACTACGG CAAGAACTCG GCGCTGGCGC TGTGGGGTTC GGGCCCGTCC 
TTCGGCATGG ACCCCAACAT GCTGCTGGCC TGGCACAACT ACGGCGGCGG CAAGGAACTG 
CTGGCCGAGA TCTACAAGAG CCTGAACATG GACGTCGTGT CCTACCTGTA TGGCCCGATG 
CCGACGCAGC CCTTCGGCTG GTTCAAGAAG CCGATCGGCA AGCTCGAGGA CATCAAGGGC 
ACCAAGTTCC GCACCGTCGG CCTGGCGGTG GACATGTACA CCGACATGGG CGCCGCGGTG 
AACCCGCTGC CGGGTGGCGA GATCGTGCCG GCGCTGGACC GCGGCCTGAT CGACGGTGCC 
GAGTTCAACA ACGCCAGCTC CGACCGCCTG CTCGGCTTCC CCGACGTGGT GAAGAACTGC 
ATGCTGCAGA GCTTCCACCA GAGCGGCGAG CAGTTCGAGA TCCTGTTCAA CAAGGGCAAG 
CTCGACGCGC TGCCGGCCGA GCTGAAGGCG ATCGTCGACT ACGGCGTGCA GGCCGCCAGC 
GCCGACATGA GCTGGAAGGC CGCGCACCGC AATTCGCTCG ACTACGGCGA GCTGAAGAAG 
GCCGGCGTGA AGTTCTACAA GACGCCCGAC GCGATCCTGC GCGCGCAGCT CGCTGCCTGG 
GACAAGATCA TCGCCAAGAA GGGCGGCGAG AACCCGCTGT TCCAGAAGGT GATCGATTCG 
CAGAAAGCCT TCGCCGCGCG CGCCGGTCAA TGGTGGAACG ATTACACGGT TGACTTCAAG 
ATGGCCTACA ACCATTATTT CGGCGCCAAG AAGGCCTGA

Protein sequence

MTQKTAPQRR RFLKKASAGA VGATAMAAPM VSVAQTTALR FQSTWPSKDI FHEYAQDFAT 
KVNNMAGGRL KIEVLPAGSV VPAFQLLEAV NKGTLDGGHG VVAYHYGKNS ALALWGSGPS 
FGMDPNMLLA WHNYGGGKEL LAEIYKSLNM DVVSYLYGPM PTQPFGWFKK PIGKLEDIKG 
TKFRTVGLAV DMYTDMGAAV NPLPGGEIVP ALDRGLIDGA EFNNASSDRL LGFPDVVKNC 
MLQSFHQSGE QFEILFNKGK LDALPAELKA IVDYGVQAAS ADMSWKAAHR NSLDYGELKK 
AGVKFYKTPD AILRAQLAAW DKIIAKKGGE NPLFQKVIDS QKAFAARAGQ WWNDYTVDFK 
MAYNHYFGAK KA