Gene Mpe_A3587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3587
Symbol
ID	4786172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3796759
End bp	3798015
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	65%
IMG OID	640092169
Product	branched-chain amino acid ABC transporter, periplasmic amino acid-binding protein
Protein accession	YP_001022775
Protein GI	124268771
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAG ATCGTGATGA CGCCCCGTTC TCCGTCGATC GCCGTCGCCT GCTGCAGGGC 
CTCGGCGCGC TGCCGCTGGC CGGCATGCCG GCCTGGGCGC TGGCCCAGCA GTTCCCGACC 
GCCAAGGTCA ACACCACCAA GCTCGCCGTC ACCGACACCG AGGTGACGGT GGGGCAGCTG 
CACTCCAAGA CCGGCACGAT GGCCATCTCG GAGACCGGCT CGGTGCAGGC CGAGCAGCTG 
GCCATCGACC AGATCAACGC GATGGGCGGC ATCCTCGGCC GCAAGATCAA GGTGATCTCC 
GAGGACGGCG CCTCCGACTG GCCGAACTTC GCCGAGAAGA GCAAGAAGCT GCTCGTCAAC 
GACCGCGTCG CCACCGTGTT CGGCTGCTGG ACCAGCGCCT CGCGCAAGGC GGTGCTGCCG 
GTGTTCGAGA AAGAGAACGG CCTGCTGTAC TACCCGACCT TCTACGAAGG CCTGGAGCAG 
AGCAAGAACG TCATCTACAC CGGCCAGGAA GCCACCCAGC AGATCATCTG GGGCCTGGAC 
TGGGGCGCGA AGGAGAAGAA GGCCAAGACC TTCTTCCTGG TCGGCTCCGA CTACATCTGG 
CCGCGCACCT CGATGAAGAT CGCGCGCAAG CACATCGAGA ACTTCCAGAA GGGCACGGTC 
AAGGGCGAGG AGTACTACCC GCTGGGCCAC ACCAACTTCA ACTCGCTGAT CAACAAGGTC 
AAGGTCGCCA AGCCCGACTG CATCTTCGCG GCGGTGGTAG GCGGCTCCAA CGTGGCCTTC 
TACAAGCAGC TCAAGGCCGC CGGCATCACC GGCGACAAGC AGTTCCTGCT GACGCTGTCG 
GTGACCGAAG ACGAGATGAC CGGCGTGGGC GGCGAGAACT TCGCCGGCTT CTACTCGTCG 
ATGAAGTACT TCCAGTCGCT GACCAACGAC AACAACAAGA AGTTCGTCGA GGCCTTCAAG 
GCCAAGTACG GCAAGGACGC CGTGATCGGC GACGTGACGC AGGCCGGGTA CCTGGGCCCG 
TGGCTGTGGA AGGCGGCGGT CGAGAAGGCC GGCAGCTTCG ACGTCGACAA GGTGGTCGCG 
GCCTCGCCCG GCATCGAACT GAAGACCGCG CCCGAGGGCT ACGTGAAGCT CGACGCCAAC 
CACCACCTGT GGAGCAAGGC GCGCATCGGC CAGGGCATGC CCGACGCGAC CTTCAAGGTG 
GTGGCGGAGT CGCCCGAGCT GATCAAGCCG GACCCGTTCC CCAAGGGATA TCAATAA

Protein sequence

MSQDRDDAPF SVDRRRLLQG LGALPLAGMP AWALAQQFPT AKVNTTKLAV TDTEVTVGQL 
HSKTGTMAIS ETGSVQAEQL AIDQINAMGG ILGRKIKVIS EDGASDWPNF AEKSKKLLVN 
DRVATVFGCW TSASRKAVLP VFEKENGLLY YPTFYEGLEQ SKNVIYTGQE ATQQIIWGLD 
WGAKEKKAKT FFLVGSDYIW PRTSMKIARK HIENFQKGTV KGEEYYPLGH TNFNSLINKV 
KVAKPDCIFA AVVGGSNVAF YKQLKAAGIT GDKQFLLTLS VTEDEMTGVG GENFAGFYSS 
MKYFQSLTND NNKKFVEAFK AKYGKDAVIG DVTQAGYLGP WLWKAAVEKA GSFDVDKVVA 
ASPGIELKTA PEGYVKLDAN HHLWSKARIG QGMPDATFKV VAESPELIKP DPFPKGYQ