Gene Mpe_A0697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0697
Symbol
ID	4783882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	726513
End bp	727790
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	640089257
Product	branched-chain amino acid ABC transporter, periplasmic amino acid-binding protein
Protein accession	YP_001019894
Protein GI	124265890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.951166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCACA CCACCCGCCG CGCCTTTGCG GCCTCGCTTT CCGCCGTGGC GCTGGCCGCT 
GCCGGCGCCT TCGTGCCCAG CGCCTTCGCG GCCGACACCA TCAAGGTCGG CGTGCTGCAC 
TCGCTGTCGG GCACCATGGC CATCTCGGAA ACCGTGCTCA AGGACACGGT GCTCATGACC 
ATCGACGAGA TCAACGCCAA GGGCGGCGTC ATGGGCAAGA AGCTCGAGCC GGTGGTGGTG 
GACCCGGCCT CCAACTGGCC GCTGTTCGCC GAGAAGGCCA AGCAGCTGAT CAGCCAGGAC 
AAGGTGGCCG TAGTGTTCGG CTGCTGGACG TCGGTGAGCC GCAAGTCGGT GCTGCCGGTG 
TTCGAGGAAA CCAACTCGCT GCTGTTCTAC CCGGTGCAGT ACGAGGGTGA GGAACTGTCC 
AAGAACGTGT TCTACACCGG TGCCGCGCCC AACCAGCAGG CCATCCCCGC GGTGGAATAC 
CTGATGAGCA AGGACGGTGG CTCGGCCAAG CGCTTCGTGC TGCTGGGCAC CGATTACGTC 
TACCCGCGCA CCACCAACAA GATCCTGCGT GCCTTCCTCA AGAGCAAGGG CGTCGCCGAG 
GCCGACATCA TGGAGGAGTA CACCCCCTTC GGCCACTCCG ATTACCAGAC CATCATCGCC 
AAGATCAAGA AGTTCTCGTC GGAAGGCAAG AAGACCGCGG TGGTGTCCAC CATCAACGGT 
GACTCCAACG TGCCCTTCTA CAAGGAACTG GGCAACCAGG GCCTGAAGGC GACCGACGTG 
CCGGTGGTGG CGTTCTCGGT GGGTGAGGAA GAGCTCCGCG GTGTCGACAC CAAGCCGCTG 
GTGGGCCACC TGGCGGCGTG GAACTACTTC ATGTCGATCA AGAACCCGAC CAACGCCGCG 
TTCATCAAGC AGTGGAGCGA CTACGCCAAG GCCAAGGGCA TCCCGGGCCA CAAGGACAAG 
CCGCTGACCA ACGACCCGAT GGAGGCCACC TACATCGGCA TCCACATGTG GGCGCAGGCG 
GTCGAGAAGG CCAAGTCCAC CGACACCGAC AAGGTCATCG CCGCCATGGC GGGCCAGACC 
TTCAAGGCGC CGGGCGGCTT CACCAGCACC ATGGACAAGG AAAACCACCA CCTGCACAAG 
CCGGTGTTCA TCGGCGAGGT CAAGGCCGAC GGCCAGTTCA ACGTGGTCTG GAAGACGCCG 
GGCCCGGTGG TCGCCGATCC GTGGAGCGAC TACATCGCCG AGAACAAGGG CAAGAAGAAC 
GTGCCGGAGA AGAAGTAA

Protein sequence

MSHTTRRAFA ASLSAVALAA AGAFVPSAFA ADTIKVGVLH SLSGTMAISE TVLKDTVLMT 
IDEINAKGGV MGKKLEPVVV DPASNWPLFA EKAKQLISQD KVAVVFGCWT SVSRKSVLPV 
FEETNSLLFY PVQYEGEELS KNVFYTGAAP NQQAIPAVEY LMSKDGGSAK RFVLLGTDYV 
YPRTTNKILR AFLKSKGVAE ADIMEEYTPF GHSDYQTIIA KIKKFSSEGK KTAVVSTING 
DSNVPFYKEL GNQGLKATDV PVVAFSVGEE ELRGVDTKPL VGHLAAWNYF MSIKNPTNAA 
FIKQWSDYAK AKGIPGHKDK PLTNDPMEAT YIGIHMWAQA VEKAKSTDTD KVIAAMAGQT 
FKAPGGFTST MDKENHHLHK PVFIGEVKAD GQFNVVWKTP GPVVADPWSD YIAENKGKKN 
VPEKK