Gene Mpe_B0517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_B0517
Symbol	hisC
ID	4787545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008826
Strand	+
Start bp	466765
End bp	467799
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	74%
IMG OID	640092946
Product	aminotransferase
Protein accession	YP_001023524
Protein GI	124263054
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.168213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0233327
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGAGCC CCGGTACGGC CGCCCGCGTC CACGGCGGTG CCGACGCACA CGGTGCCGCG 
CGCTGGGACT TCTCCACCTG CGCCAACGCG GCGGGACCGT GCCCGGCCGC GCTCGCAGCC 
GTGCAGGCAG CCGACGCGAC GCGCTACCCC GACCCGGCCG CCACGGCAGT CCGGCAGGCG 
CTGGGGGCAC TGCACGACGT CGAGCCTTCG CGGATCCTGC CCGCCGCCAG TGCGAGCGAA 
TTCATCCAGC GTGTCACCGC GGTCACCGCT CGGCTTTGGC CCGGTGCCGT GCGGGTTCCC 
CGCTTCGCGT ATGGCGACTA CGCGGCGGCC GCCGCGGCGT GGGGCCGCCC CTTTGTCCCC 
CAGGATGTCG AGGTCCCGGG CACGCCGTCG CAGTGCACGC TGCGCTGGCA CGCCGATCCG 
ACGAGTCCGC TGGGCCAGGA CGGCGCTGTC GCCCGTGACG ACTCCTATTG CTGCCCCGCC 
GTGCTCGACG CGGTGTACGC GCCGCTACGG CTTCAGGGAG CGTCGGCGTG GACGGCATCC 
GCGCGCGATG CGGTCTTCGT GTTGCACAGC CCCAACAAGG CGCTGGGCCT GACCGGCGTG 
CGCGGCGCCT ACGCGGTCGC GCCACGAGAT CGCGGTGGCG CCGGCTACGA CGTGCTGGCC 
TGCCGAGCCG CGCTGGAGGC TGCGGCGCCG TCGTGGCCGC TGTCGGCCCA CGCCGAGGCC 
ATGCTGCTGG CCTGGGCCAC GCCCGACGTG CACGCCTGGG TGGCCGAATC ACGCACCACC 
CTGGTGGCAT GGAAGTCGGA CCTGCTGCGG CGCCTGTCGG CACGCGGCTT CGAGGTGCGG 
CCGAGCGTGA CGCCGTACGT CATCGTGCGC CCACCGCGCC CCGTGGCACC ATCGCTGCTG 
CGCAGGCACC ACGTCGCGGT ACGCGACGCG ACCTCGTTCG GCCTGCCGGG CTGGTGGCGC 
CTCTCGGCGC AAGCGCCCTC GGCACAGGAC GCGTTGATGC ACGCACTGGA CCTGCTCGAC 
GGGGGCCTGC CATGA

Protein sequence

MVSPGTAARV HGGADAHGAA RWDFSTCANA AGPCPAALAA VQAADATRYP DPAATAVRQA 
LGALHDVEPS RILPAASASE FIQRVTAVTA RLWPGAVRVP RFAYGDYAAA AAAWGRPFVP 
QDVEVPGTPS QCTLRWHADP TSPLGQDGAV ARDDSYCCPA VLDAVYAPLR LQGASAWTAS 
ARDAVFVLHS PNKALGLTGV RGAYAVAPRD RGGAGYDVLA CRAALEAAAP SWPLSAHAEA 
MLLAWATPDV HAWVAESRTT LVAWKSDLLR RLSARGFEVR PSVTPYVIVR PPRPVAPSLL 
RRHHVAVRDA TSFGLPGWWR LSAQAPSAQD ALMHALDLLD GGLP