Gene MCA1963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1963
Symbol	hisD
ID	3102435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	2115248
End bp	2116558
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	65%
IMG OID	637171118
Product	histidinol dehydrogenase
Protein accession	YP_114396
Protein GI	53803969
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.318488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAG TAAAAATCAA ACGGCTTTAC ACCGGCGATG CGGACTTTGC ATCGCAACTG 
GACAGGCTGC TTGCCTGGAG CGAAAGCGAG GACACCGACA TCCACCAGCG CGTGACCGAG 
ATCATCGGCT GCATCCGCCG CGATGGCGAT GCGGCCCTGG TGGAGCTCAC GGCCCGTTTC 
GACCATTTCG TCGTGGATAC CGCTGCGGCG CTCGAGCTGC CGCGTGACGT GCTGGAAGCG 
GCCTGGCAGG CGCTGCCCGC CGAACAAGCC AAAGCCCTGC GGGAAGCGGC GGAGCGCATC 
CGGGCCTACG CCGAGCGGCA AAAGCTCGAT TCCTGGGACT ACCGTGAAGC CGACGGCACT 
TTGCTGGGAC AGAAGATCAC GCCGCTCGAC CGGGTCGGCC TGTATGTACC CGGTGGCAAG 
GCCGCATATC CTTCCTCGGT ACTGATGAAT GCGGTTCCTG CCAAGGTGGC GGGCGTGCCG 
GAACTCATCA TGGCGGTGCC GGCTCCGCGG GGAGAGCTGA ACGCCCTGGT GCTGGCTGCC 
GCCTATATTT CCGGAGTGGA CCGGGTTTTC CGCATCGGTG GCGCACAGGC CGTCGCCGCC 
CTGGCTTATG GGACGGAAAC GGTGCCGCGG GTCGACAAGA TCGTCGGCCC CGGTAACATC 
TATGTGGCGA CCGCCAAAAA GCTGGTGTTC GGCCAAGTCG GGATCGACAT GGTCGCAGGC 
CCCTCGGAGA TCCTGGTGAT CTCGGACGGA CGGACCGACC CGGACTGGAT CGCCATGGAT 
CTGTTTTCGC AAGCCGAGCA TGACGAGGAC GCCCAGGCGA TCCTGATCAG CCCGGATGCA 
GCCCATCTGG AGGCGGTACA GGCAAGCATC GAGCGGCTGT TGCCCGGCAT GGAGCGCGCC 
GAGGTCATCC GCACCTCGCT GGAGCGGCGC GGCGGCATGA TCCTGGTCGA TGATCTGGAG 
CAGGCGGCGG CGGTCGCCAA TCGCATCGCG CCGGAACATC TGGAGCTTTC GGTGGAGAGC 
CCGGAGGTCC TGGTGGAGTC GATCCGCAAT GCCGGGGCCA TCTTCATGGG GCGCTATACC 
GCGGAAGCGC TCGGCGATTA CTGTGCCGGT CCCAACCACG TCCTGCCGAC TTCGGGCACG 
GCGCGCTTCT CGTCGCCGCT GGGCGTCTAT GATTTCCAGA AGCGTTCCAG CCTGATCTAC 
TGTTCGCCAG ACGGCGCAGA CCAACTGGGC CGTACCGCTT CGCTGCTGGC CTGGGGCGAA 
GGGCTGGGGG CGCATGCCCG TTCGGCCGAA TATCGGATCA GGCACCATTA A

Protein sequence

MTEVKIKRLY TGDADFASQL DRLLAWSESE DTDIHQRVTE IIGCIRRDGD AALVELTARF 
DHFVVDTAAA LELPRDVLEA AWQALPAEQA KALREAAERI RAYAERQKLD SWDYREADGT 
LLGQKITPLD RVGLYVPGGK AAYPSSVLMN AVPAKVAGVP ELIMAVPAPR GELNALVLAA 
AYISGVDRVF RIGGAQAVAA LAYGTETVPR VDKIVGPGNI YVATAKKLVF GQVGIDMVAG 
PSEILVISDG RTDPDWIAMD LFSQAEHDED AQAILISPDA AHLEAVQASI ERLLPGMERA 
EVIRTSLERR GGMILVDDLE QAAAVANRIA PEHLELSVES PEVLVESIRN AGAIFMGRYT 
AEALGDYCAG PNHVLPTSGT ARFSSPLGVY DFQKRSSLIY CSPDGADQLG RTASLLAWGE 
GLGAHARSAE YRIRHH