Gene Mvan_2804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_2804
Symbol	hisD
ID	4646536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	2972542
End bp	2973897
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	71%
IMG OID	639806285
Product	histidinol dehydrogenase
Protein accession	YP_953617
Protein GI	120403788
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAGCG TGAGTGTATC GCCAGGGCTT CTGCGGCGCA TCGATCTGCG CGGCACCACG 
CTGTCGGCGG CCCGCCTGCG CTCGGCACTG CCGCGCGGCG GTGTCGACGT CGACACCGTC 
GTGCCCAAAG TCAGGCCTAT CGTCGATGCG GTCGCCGAGC GCGGAGCCGC CGCGGCGCTG 
GAGTACGGTG CCGCGTTCGA CGGTATCCGG CCCGACCAGG TGCGGGTTCC CGCCGAAAGG 
CTGAAGGCGG CGCTCGCCGA GCTCGATCCC GATGTCCGCA CCGCGCTGGA GGTCGCGATC 
GAGCGGGCCC GCGCCGTGCA CGCCGATCAG CGCCGCACCG ACACCACGAC CACACTCGCG 
CCGGGCGCCA CCGTGACCGA GCGCTGGGTG CCCGTCGAGC GGGTCGGACT CTACGTGCCC 
GGCGGAAACG CCGTCTACCC GTCCAGCGTC GTGATGAACG TGGTGCCCGC CCAGACCGCG 
GGCGTGGACT CGCTGGTGAT CGCCAGCCCG CCGCAGGCGG GGAATGCTGA GCCCTTCAAG 
GGCCTTCCGC ATCCGACGAT CCTGGCCGCG GCGGCGCTGC TCGGTGTCGA CGAGGTCTGG 
GCGGTCGGCG GGGCCCAGGC CGTCGCGTTG CTGGCCTACG GCGGCGTCGA CACCGACGGA 
GCCGAACTCG CTCCGGTCGA CATGATCACC GGGCCCGGCA ACATCTACGT CACCGCCGCC 
AAACGCATCT GCCGGTCGGC GGTCGGCATC GACGCCGAGG CCGGCCCCAC CGAGATCGCG 
ATCCTGGCCG ACCACACCGC CGACCCGGCG CACGTCGTCG CGGACCTGAT CAGTCAGGCC 
GAGCACGACG AGATGGCCGC CAGCGTCCTG GTCACCGACA GCGCCGAGTT GGCCGACGCC 
ACCGACCGCG AGCTGGCCGT ACAGCTGGAG ACCACCGTGC ACCGCGAGCG GGTGACGGCC 
GCGCTGGGTG GGCAGCAGTC GGCGATCGTC CTCGTCGACG ACATCGAGGC CGGGATCCGC 
ACCGTGAACG CCTACGCCGC CGAGCACCTG GAGATCCAGA CCGTCGACGC GGCCGCTGTC 
GCGGGCAGGA TCCGTTCTGC CGGAGCGATT TTCGTCGGTC CGTGGTCACC GGTGAGCCTC 
GGTGACTACT GCGCAGGCTC GAACCATGTG CTCCCCACCG CGGGCTGCGC CCGGCATTCC 
AGTGGATTGT CGGTGCAGAC CTTCCTGCGC GGCATCCACG TCGTGGACTA CACCGAGGCG 
GCGCTGAAGG ACGTGTCGGG CTACGTCATC ACGCTGGCCA AGGCCGAGAA CCTGCCCAGC 
CACGGCGAAG CCGTGCGCCG GAGGTTCGAG CGGTGA

Protein sequence

MVSVSVSPGL LRRIDLRGTT LSAARLRSAL PRGGVDVDTV VPKVRPIVDA VAERGAAAAL 
EYGAAFDGIR PDQVRVPAER LKAALAELDP DVRTALEVAI ERARAVHADQ RRTDTTTTLA 
PGATVTERWV PVERVGLYVP GGNAVYPSSV VMNVVPAQTA GVDSLVIASP PQAGNAEPFK 
GLPHPTILAA AALLGVDEVW AVGGAQAVAL LAYGGVDTDG AELAPVDMIT GPGNIYVTAA 
KRICRSAVGI DAEAGPTEIA ILADHTADPA HVVADLISQA EHDEMAASVL VTDSAELADA 
TDRELAVQLE TTVHRERVTA ALGGQQSAIV LVDDIEAGIR TVNAYAAEHL EIQTVDAAAV 
AGRIRSAGAI FVGPWSPVSL GDYCAGSNHV LPTAGCARHS SGLSVQTFLR GIHVVDYTEA 
ALKDVSGYVI TLAKAENLPS HGEAVRRRFE R