Gene Mpe_A0312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0312
Symbol
ID	4786862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	337608
End bp	338519
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	70%
IMG OID	640088864
Product	branched chain amino acid: 2-keto-4-methylthiobutyrate aminotransferase
Protein accession	YP_001019509
Protein GI	124265505
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01121] D-amino acid aminotransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.381931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00369905
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCCGC TGCCCAGCGC CATCCCCGCG GCGAGCGCCG ACTCGCTGTG CTACCTGAAC 
GGCGACTACA CCCGCCTGGC GGACGCTCGC GTCAGCGTGC TCGACCGCGG CTTCATGTTC 
GGCGACGGCG TCTACGAGGT CCTGCCCGTC TACGATCGTC GGCTGTTCCG CTTCGACGAG 
CACATGGCGC GCCTGGAGCG CAGCCTCGCC AAGGTGCGCA TCACCGCGCC GCTGACCCGC 
GAGGACTGGC TGGCGCGCAT GCGCCGGCTG GTCGCGGCCC AGCACGAGCA CAGCGGGGCG 
ACCGACCAGC TCGTGTACCT GCAGGTCACG CGCGGCGTGG CGCTGCGCGA GCACACGATG 
CCGACCGACA TCGAGCCCAC GGTCTTCATG ATGTGCAGTC CGGCGAAGCC GCCGACGCCC 
GAGCAGCGCC ATGCCGGCGT GGCCTGCATC AGCGCGCGCG ACTTCCGCTG GGAGCGCGGC 
GACATCAAGA GCATTTCGCT GCTCGGCAAC GTGCTGGCGC GGCAGATGTC GGCCGACAAG 
GGCGCCGTCG AGACCCTCCT GTTTCGCGAC GGCTTCCTGA CCGAGGCAGC GGCGTCCAAC 
GTGTGGATGG TGAAGGAAGG CGCACTGATC GGCCCGCCGA AGAGCGAACT GCTGCTCGAA 
GGCGTGCGGG TCGACCTGCT GGCCGAGCTG TGCGAGGAGT GCGGCATCGG CTACAGCCTG 
CGGCCGGTCA GCGAGGGCGA GGTCTTCTCG GCCGACGAAC TGCTGCTGAG TTCGGCGATG 
AAGGAAGTGC TGGCGGTCAC CCGTCTCGAT GGCGAACTGG TCGGGCACGG CGCGTTGCGC 
GGCAAGCCCG GGCCGGTGTA CGCCCGGCTC TACGAGGCCT ACCAGCGGGC CAAGCCCGCC 
CAGTCGATCT GA

Protein sequence

MNPLPSAIPA ASADSLCYLN GDYTRLADAR VSVLDRGFMF GDGVYEVLPV YDRRLFRFDE 
HMARLERSLA KVRITAPLTR EDWLARMRRL VAAQHEHSGA TDQLVYLQVT RGVALREHTM 
PTDIEPTVFM MCSPAKPPTP EQRHAGVACI SARDFRWERG DIKSISLLGN VLARQMSADK 
GAVETLLFRD GFLTEAAASN VWMVKEGALI GPPKSELLLE GVRVDLLAEL CEECGIGYSL 
RPVSEGEVFS ADELLLSSAM KEVLAVTRLD GELVGHGALR GKPGPVYARL YEAYQRAKPA 
QSI