Gene Mpe_A2835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2835
Symbol
ID	4785408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3015300
End bp	3016382
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	65%
IMG OID	640091406
Product	putative exported solute binding protein
Protein accession	YP_001022024
Protein GI	124268020
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGCC GTTCCTTCGT GCAACGGGCC GGTCTGGCCG GTGTGCTGGC CACGGGCGCC 
GCACCGGCGG TCGTGCACGC CCAGAGCAAC CTGCGCTGGC GGCTGGCTTC GAGTTTCCCG 
AAGTCGCTCG ACACGATCTT CGGCACGGCC GAACTGTTCG CGAAGAAGGT CGGCGAGATG 
AGCGGTGGCC GATTCCAGAT CTCGGTGCAT GCGGCCGGCG AGCTGGTGCC GGCCTTTGGC 
GTGGTCGACG CGGTGCAGAA CGCCACCGTC GACATTGCCC ACACCGCGCC CTACTACTTC 
TACGGCAAGG ACCCGACCTT CTGCCTCGGC TGCGCGGTGC CGTTCGGGTT GAACTCCCGC 
CAGATGTCTG CGTGGATGTA CGACGGCAAC GGCCTGAAAC TGATGCGCGA GTTCTACGCC 
AAGTACAACA TCGTCAACTT CCCCGGCGGC AACACCGGTG CGCAGATGGG CGGCTGGTTC 
CGCAAGGAGA TCAAGTCCAT CGCCGACATC AAGGGTCTGA AGTTCCGCTG CAACCCGTTT 
GCCGGCCGCG TGCTCGAGCC CTTCGGCGTG GTGCCGCAGT CGCTGCCGGG CGGCGACATC 
TACCCCGCGC TCGAGAAGGG CACCATCGAC GCGGCGGAAT GGGTCGGTCC CTACGACGAC 
CTCAAGCTCG GTTTCAACAA GGTGGCGCCG AACTATTACT ACCCGGGCTG GTGGGAGGGT 
GGGCCGCAGC TCGACTTCTT CATCAACAAC AAGGCGTGGG AGGCGCTGAC GCCCGACTAC 
AAGTCGATGA TCGAGGCCGC CGCGGCGCAG TCGCACATCG AGATGCAGGC GCGCTACGAC 
GCGCGCAATC CACCGGCTTT GAAGCAGCTG GTGGGTTCGG GCACCAAGCT CAAGCCCTTC 
CCGGCCGACG TGATGACCGC GGCATTCAAG TCGGCCGAGC AGATCTACGC CGACCTGTCG 
GCCAAGAACC CGTCCTGGAA GAAGGTGTGG GAGGACTACG CGAAGTTCCG CGCCGAGCAG 
AACGTGTGGT TCCGCTTCAC CGAGGCGACC TTCGACCGTT TCATGCAGTC GCAGAAGCTC 
TGA

Protein sequence

MQRRSFVQRA GLAGVLATGA APAVVHAQSN LRWRLASSFP KSLDTIFGTA ELFAKKVGEM 
SGGRFQISVH AAGELVPAFG VVDAVQNATV DIAHTAPYYF YGKDPTFCLG CAVPFGLNSR 
QMSAWMYDGN GLKLMREFYA KYNIVNFPGG NTGAQMGGWF RKEIKSIADI KGLKFRCNPF 
AGRVLEPFGV VPQSLPGGDI YPALEKGTID AAEWVGPYDD LKLGFNKVAP NYYYPGWWEG 
GPQLDFFINN KAWEALTPDY KSMIEAAAAQ SHIEMQARYD ARNPPALKQL VGSGTKLKPF 
PADVMTAAFK SAEQIYADLS AKNPSWKKVW EDYAKFRAEQ NVWFRFTEAT FDRFMQSQKL