Gene MCA1113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1113
Symbol	hisC-1
ID	3103953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1168166
End bp	1169239
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	63%
IMG OID	637170298
Product	histidinol-phosphate aminotransferase
Protein accession	YP_113583
Protein GI	53804538
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.459225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCCT ATTGGAGTGC GCTGGTCCGG GATCTGAAAC CCTACGTACC CGGCGAACAG 
CCCAAGCTGG ACAATCTCGT CAAGCTGAAC ACCAACGAGA ATCCGTACCC GCCCTCGCCC 
AAAGTGTTGG CCGCGATCCG CGGCGAACTC GGTGCATCCC TGCGGCTCTA TCCAGACCCG 
AACGCCGAAC TGCTCAAACA GGCCATCGCG CGCTATCACG GCGTCGGTGC GAACCAGGTG 
TTCGTCGGGA ATGGCTCGGA CGAAGTCCTG GCGCATGCGT TTCAGGCCTT GCTGAAACAG 
ACTCGGCCCA TCCTGTTCCC TGACATCACC TACAGTTTTT ACCCCGTCTA TTGCGGGCTG 
TACGACATCG CTCACGAGAC CGTACCCCTG ACCGAAAGTT TCGAGATCCG GATCGAAGAT 
TACCTGCGGC CCAACGGCGG CGTCGTCTTT CCCAATCCCA ACGCGCCGAC GGGCCGGCTG 
TTGCCGCTCG CGGACATCGA AACGCTGCTG TCGAAGAACC GCGACTCGGT CGTGATCGTG 
GACGAGGCCT ATATCGACTT CGGCGGTGAA TCGGCAGCGG CGCTGGTCAA CCGATTCCCC 
CATCTGCTCG TGATCCAGAC GCTGTCTAAA TCGAGATCGC TGGCTGGTCT GCGCGTCGGC 
TTCGCACTCG GCGAGCCGGG ACTGATCGAG GCGCTGGAGC GAGTCAAGGG CAGCTTCAAT 
TCCTATCCGC TCGACCGCCT GGCGATCGTG GGGGGAGTCG CGGCCTTCGA CGACCGTGAC 
CACTTCGAAT GGTCCCGGCA GGCCATCATG TGGACCCGGC AATGGCTTAG CCGGGGACTC 
GCCGAGTTGG GCTTCGAAGT GCTGCCGTCG GCCGCCAATT TCGTATTCGT CCGCCATCCC 
AGGCACGATG GCGCAGAGCT GGCGGCCGCG CTGCGGGACA GGCACATCAT CGTCCGCCAC 
TTCAAGCTGC CGAGGATCGA CCAGTTCCTC CGCATCACCG TGGGAACGGA AGGGGAGTGC 
CAGATTCTCC TCGACGCTTT GAGCGAACTG GTGGCGGGAC AGGCGGCCGC CTAG

Protein sequence

MNPYWSALVR DLKPYVPGEQ PKLDNLVKLN TNENPYPPSP KVLAAIRGEL GASLRLYPDP 
NAELLKQAIA RYHGVGANQV FVGNGSDEVL AHAFQALLKQ TRPILFPDIT YSFYPVYCGL 
YDIAHETVPL TESFEIRIED YLRPNGGVVF PNPNAPTGRL LPLADIETLL SKNRDSVVIV 
DEAYIDFGGE SAAALVNRFP HLLVIQTLSK SRSLAGLRVG FALGEPGLIE ALERVKGSFN 
SYPLDRLAIV GGVAAFDDRD HFEWSRQAIM WTRQWLSRGL AELGFEVLPS AANFVFVRHP 
RHDGAELAAA LRDRHIIVRH FKLPRIDQFL RITVGTEGEC QILLDALSEL VAGQAAA