Gene Mpe_A1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1947
Symbol
ID	4786708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2083042
End bp	2084244
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	69%
IMG OID	640090517
Product	aminotransferase
Protein accession	YP_001021140
Protein GI	124267136
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.564759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.128663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCG CCCACCTCCT GGCCCGCACG CCCGTGCCGC CCAGCCGCCT GCCGCGGGTG 
GGCACGACGA TCTTCACCGT GATGTCCGCG CTGGCCCAGG AGCACGGCGC GGTCAACCTC 
GGCCAGGGCT TCCCGGACTT CGAGTGCGAC CCGCGCCTGG TCGATGCCGT GACGCAGGCC 
ATGCAGGCAG GCCACAACCA GTACCCGCCG ATGGCCGGCG TGCCGGTGTT GCGCGAAGCA 
GTCGCCGCAA AGATCGCCGC GCTCTATGGT CACCGCTACG ACCCCGGCAG CGAGATCACC 
ATCACCGCTG GCGCGACCCA GGCCATCCTG ACCGCGATCC TCGCGCTGGT GCATCCGGGC 
GACGAGGTGA TCGTCCTTGA GCCCTGCTAC GACAGCTATG CGCCAAACAT CGAACTGGCC 
GGCGGCCGAG TACGGCGGGT GCCGCTGACG CCGGGCCGCT TCCGGCCGGA CTTCGACCGT 
ATCGCCGCGG CGCTCGGGCC GCGCACCCGC GCAATCCTCG TCAACACGCC GCACAACCCG 
AGCGCCACGG TGTGGACCGC CGGCGAGATG CAGCGCCTGG CCGATCTGCT GCGGCCCACC 
AACGTGATCG TCATCGCCGA CGAGGTCTAC GAGCACATGG TGTTCGACGG CCAAGCCCAC 
CAGAGCGTGG CTCGCCATGC GGAGCTCGCC GCGCGCTCCG TCATCGTGTC GAGCTTCGGA 
AAGACCTTTC ATGTGACCGG CTGGAAGGTG GGCTACGCCG CGGCCCCGGC CGAACTGATG 
GCGGAGTTCC GCAAGGTGCA TCAATTCAAT GTGTTCACCG TCAACACGCC GGTGCAGCAC 
GCGCTGGCCG CCTACCTGGG CGACCCTCGC CCCTACCTGG ACCTGCCGGA TTTTTATGCA 
CGCAAGCGCG ACCGCTTCCG CGCCGGGCTC GCGGACACCG GCCTCGACCT GATGCCCAGC 
GAAGGCAGCT ACTTCCAGTG CGTGGGTTAT GGCGGCCTGG CCGCGCATCG GGCGCGCAGC 
GAAGCCGAGT TCTGCCGCTG GTTGACCACC GAGGCCGGCG TCGCGGCGAT TCCGCTGTCG 
GCGTTCTACG ACGCCGGATT CGAACAGCGG GTCGTGCGCT TCTGCTTTGC CAAGCGCGAA 
GGCACGCTGG ATGCCGCGTT GCAGCGGCTG CGCACGGCGC TGTCCGCGCG ATCTCCCGGC 
TGA

Protein sequence

MSSAHLLART PVPPSRLPRV GTTIFTVMSA LAQEHGAVNL GQGFPDFECD PRLVDAVTQA 
MQAGHNQYPP MAGVPVLREA VAAKIAALYG HRYDPGSEIT ITAGATQAIL TAILALVHPG 
DEVIVLEPCY DSYAPNIELA GGRVRRVPLT PGRFRPDFDR IAAALGPRTR AILVNTPHNP 
SATVWTAGEM QRLADLLRPT NVIVIADEVY EHMVFDGQAH QSVARHAELA ARSVIVSSFG 
KTFHVTGWKV GYAAAPAELM AEFRKVHQFN VFTVNTPVQH ALAAYLGDPR PYLDLPDFYA 
RKRDRFRAGL ADTGLDLMPS EGSYFQCVGY GGLAAHRARS EAEFCRWLTT EAGVAAIPLS 
AFYDAGFEQR VVRFCFAKRE GTLDAALQRL RTALSARSPG