Gene Mpe_A3756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3756
Symbol
ID	4785985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3975700
End bp	3976923
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	65%
IMG OID	640092339
Product	putative substrate-binding periplasmic (pbp) ABC transporter protein
Protein accession	YP_001022944
Protein GI	124268940
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.260098
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCG TTCGCTCGCG CACCGCACTC GCTGCCGCCG CCACCGCCGG CCTCCTCGCC 
GTCGGCGGCA CGCCGGCACA GGCCCAGATC TCCGGGGACA CGGTCAAGAT CGGCTTCATC 
ACCGACATGT CGGGCCTGTA CGCCGACATC GACGGCCCCG GCGGCGTCGA GGCCATCAAG 
CTGGCCATCA GCGACATGAA GGGCACGGTC GCCGGCAAGA AGATCGAGCT CGTCTACGCC 
GATCACCAGA ACAAGGCCGA CGTGGCCGCC AGCAAGGCCC GCGAATGGTT CGACACCCAG 
GGCGTCGACA TGCTCATCGG CGGCACCAAC TCCGGCACCG CGCTGGCCAT GACCAAGGTC 
GCGGCCGAGA AGAAGAAGCC CTTCATCGCC ATCGGTGCCG GCACCTCGCG CATCTCGAAC 
GAGGATTGCA CGCCCTACTC GATCCACTAT GCCTACGACA CCGTGGCGCT GGCCAACGGC 
ACCGGCAGCG CAGTCACCAA GGCGGGCGGC AAGTCCTGGT ATTTCCTGAC GGCCGACTAT 
GCCTTCGGCC AGTCGCTGCA GAACGACACC AGCAACGTGG TGACGAAATC GGGCGGCCAG 
GTGCTCGGCA GCGTCAAGCA CCCGCTGTCG GCCAGCGATT TCTCGTCCTT CCTGCTGCAG 
GCGCAGTCGA GCAAGGCGCA GATCCTGGGG CTGGCCAATG CCGGCGGCGA CACCATCAAC 
TCGATCAAGG CCGCCAACGA GTTCGGCATC ACGAAGACGA TGAAGCTGGC CGGCCTGCTG 
ATGTTCATCA ACGACATCCA TTCGCTGGGC CTGAATGCGA CCCAGGGCAT GTACATGACC 
GACAGCTGGT ACTGGAACCA GAGCCCGGAG GCGCGCGCGT GGAGCCGCCG CTTCTTCGAG 
AAGATGAAGC GCATGCCCTC GTCGATCCAG GCGGCCGACT ACTCGGCCGC CATGCACTTC 
CTGAAGGCCG TCGAGGCCGC CAAGACCGAC GACGGCGACA AGGTCATGGC GCAGATGAAG 
GCCATGCCGA TCAACGACTT CTACGCCAAG GGCAGCATCC GCAAGGAAGA CGGTCGCGGC 
ATCCACGACA TGTTCCTGCT GCAGGTGAAG TCGCAGCAGG AGTCGACCGA GCCCTGGGAC 
TACTTCAAGG TGGTCGAGAA GATCCCCGGC GAACAGGCCT TCACGAAGCT GGCCGACAGC 
AAGTGCCCGC TGGTGAAGAA GTGA

Protein sequence

MTLVRSRTAL AAAATAGLLA VGGTPAQAQI SGDTVKIGFI TDMSGLYADI DGPGGVEAIK 
LAISDMKGTV AGKKIELVYA DHQNKADVAA SKAREWFDTQ GVDMLIGGTN SGTALAMTKV 
AAEKKKPFIA IGAGTSRISN EDCTPYSIHY AYDTVALANG TGSAVTKAGG KSWYFLTADY 
AFGQSLQNDT SNVVTKSGGQ VLGSVKHPLS ASDFSSFLLQ AQSSKAQILG LANAGGDTIN 
SIKAANEFGI TKTMKLAGLL MFINDIHSLG LNATQGMYMT DSWYWNQSPE ARAWSRRFFE 
KMKRMPSSIQ AADYSAAMHF LKAVEAAKTD DGDKVMAQMK AMPINDFYAK GSIRKEDGRG 
IHDMFLLQVK SQQESTEPWD YFKVVEKIPG EQAFTKLADS KCPLVKK