Gene MCA1417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1417
Symbol	hisC-2
ID	3102073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1503295
End bp	1504410
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	64%
IMG OID	637170592
Product	histidinol-phosphate aminotransferase
Protein accession	YP_113874
Protein GI	53804253
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCA CCACTCTCGC CGTCCCCGGC GTTCGCGGAC TCACCCCTTA CCAGCCCGGC 
AAACCCATCG GCGAGCTGGA ACGGGAGTTC GCTCTGAAGC GCATCGTCAA GCTGGCCTCC 
AACGAGAATC CCCTCGGCGC GAGCCCCAAG GTGCTGGAAG TCGTGCGGCG GATACTCGGG 
GGCACTCACC TTTATCCCGA CGGCAGCGGC TTCGAACTGA AGGCGGCACT GGCTGAAAAA 
CTCGGCGTCG AGCCGGCGCA GATCGTCCTC GGCAATGGAT CCAATGATGT GCTCGATCTG 
GTGGCGAGGG CGTTCCTCAC AGCCGGACGC AATGCGGTGT ATTCCGAATA TGCCTTCGCC 
GTGTATCCGA TTGCGACCCA GACCGCAGGA GCGACGGGAA AAACGGCCCC GGCCCATGAC 
GGCAGCCGGG GTCCACGCTT CGGCCATGAT CTGGAAACCA TGTTGGAGCG GGTCGATCCC 
GATACCCGCG TGGTCTTCAT CGCCAATCCG AACAATCCGA CCGGGACGCT GCTCGGCCGG 
GGAGAGCTGT ATTCGTTTCT GGCGGCGCTG CCCGAGCATG TCATTGCAGT CGTGGACGAG 
GCCTATTTCG AGTACGCACG GCGCCCCGAC CATCCGGACG CCTTGGAGTG GCTGGGGGAG 
TTTCCAGGCC TGATCGTCAC CCGCACGTTC TCCAAGGCCT ACGGACTGGC GGGCCTTAGG 
GTCGGATATG CGGTTACCGG GGTGGAGATC GCCGACCTGC TGAACCGTGC CAGGCAGCCG 
TTCAACGTCA ACACCCTGGG ACTGGCCGCC GCGGCCGCCG CCCTGGAAGA TACCGGCTTC 
CTGGAAGCCA CGGTACAGGC GAACGACGCC GGCAGGAGCC AGCTGGAAGC CGGTTTCCGA 
GAGCGGGGCT TCGATTTCAT CCCTTCCGCC GGCAATTTCG TCAGCTTCGA CCTGGGGAGG 
CCGGCCACTC CGGTTTTCGA CGCGCTGCTG CGCGAAGGCG TCATCGTGCG GCCATTGGGA 
AATTACGGCC TGCCGAACCA TCTCCGGGTG TCGGTCGGCA CCGCAGAAGA AATCGACCTC 
TTCTTCGCCG CCCTGGACCG CGTGCTGGTT CCATGA

Protein sequence

MSITTLAVPG VRGLTPYQPG KPIGELEREF ALKRIVKLAS NENPLGASPK VLEVVRRILG 
GTHLYPDGSG FELKAALAEK LGVEPAQIVL GNGSNDVLDL VARAFLTAGR NAVYSEYAFA 
VYPIATQTAG ATGKTAPAHD GSRGPRFGHD LETMLERVDP DTRVVFIANP NNPTGTLLGR 
GELYSFLAAL PEHVIAVVDE AYFEYARRPD HPDALEWLGE FPGLIVTRTF SKAYGLAGLR 
VGYAVTGVEI ADLLNRARQP FNVNTLGLAA AAAALEDTGF LEATVQANDA GRSQLEAGFR 
ERGFDFIPSA GNFVSFDLGR PATPVFDALL REGVIVRPLG NYGLPNHLRV SVGTAEEIDL 
FFAALDRVLV P