Gene Smed_4290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4290
Symbol
ID	5318453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	784009
End bp	785316
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	62%
IMG OID	640776095
Product	histidinol dehydrogenase
Protein accession	YP_001313028
Protein GI	150376432
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.682921
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGA CCTATCTCAA GCGCGGCAAG CCCGAGGCCC AGCGATCGGA GGAAGATGCG 
AAGGTCCGCG GGATCGTCGA GTCGACGCTT AAGGACATCG AGACGCGCGG CGACCAGGCG 
GTTCGAGAAC TTTCTGAGAA GTTCGACAGG TTTTCGCCGC CGTCTTTCCG GCTCAGCCCA 
TCGGAGATCG AGGCGGCCAT GTCCAGGGTC TCAACGCGCG ACATGACCGA TATCGACTTC 
GCCCAGACGC AGATCCGCCG CTTCGCCGAG GCGCAACGCG CCTCGATGAC GGATATCGAG 
ATCGAGACGA TTCCGGGGGT AATCCTCGGT CATCGCAACA TTCCCGTACA GTCGGTCGGG 
TGTTACGTGC CCGGGGGCAA GTTCCCGATG GTGGCCTCCG CCCATATGTC GGTCCTGACG 
GCCGCGGTTG CCGGCGTGCC GCGCATCGTT GCCTCCGCTC CTCCCCAGAA GGGTGCGCCG 
CATCCGGCGA TCGTGGCGGC GATGCACAAA GCCGGTGCCC ACGAAATCTA CGTGCTCGGC 
GGCATGCAGG CGGTCGGCGC GATGGCGCTC GGAACCGAGA CGATCAAGCC CGTCGACATG 
CTGGTGGGTC CGGGAAATGC CTTCGTTGCC GAAGCCAAAC GGCAGTTGTA CGGCCGCGTC 
GGAATAGATC TCTTCGCCGG TCCGACCGAG ACGATGGTGA TTGCCGACGA GACGGTGGAT 
GCGGAGATAT GCGCAACCGA TCTCCTCGGT CAGGCCGAGC ATGGTTACAA TTCTCCGGCG 
GTGCTTGTGA CCAATTCACG CAGGCTTGCC GATGAGACGC TTGCGGAAAT CGGCCGGCTT 
CTTTCGATCC TGCCGACGGC GGACACCGCC AGTGCCTCAT GGCGCGACTA CGGCGAAGTG 
ATCGTCTGCG ACACCTATGA GGAAATGCTC GACGTCGCCA ATGAAATCGC CTCCGAGCAC 
GTGCAGGTCA TGACCGATCG CGATGATTGG TTCTTGGAGA ACATGCATTC CTACGGTGCG 
CTTTTCCTTG GGCCACGCAC CAATGTCGCC AATGGCGACA AGGTCATCGG AACCAACCAC 
ACCCTGCCGA CCAGGAAGGC GGGGCGCTAT ACGGGTGGCC TCTGGGTCGG CAAGTTCATG 
AAGACGCATT CCTACCAGAA GGTGCTGACA GACGAGGCGG CTGCGGAAAT CGGCGCCTAT 
TGCTCGCGCC TGTGCCTGCT GGAGGGCTTT ATAGGCCATG CGGAGCAGGC CAATGTCCGG 
GTTCGCCGAT ACGGCGGACG CAATATCGGC TATGGCGGCG CGGCGTAG

Protein sequence

MTVTYLKRGK PEAQRSEEDA KVRGIVESTL KDIETRGDQA VRELSEKFDR FSPPSFRLSP 
SEIEAAMSRV STRDMTDIDF AQTQIRRFAE AQRASMTDIE IETIPGVILG HRNIPVQSVG 
CYVPGGKFPM VASAHMSVLT AAVAGVPRIV ASAPPQKGAP HPAIVAAMHK AGAHEIYVLG 
GMQAVGAMAL GTETIKPVDM LVGPGNAFVA EAKRQLYGRV GIDLFAGPTE TMVIADETVD 
AEICATDLLG QAEHGYNSPA VLVTNSRRLA DETLAEIGRL LSILPTADTA SASWRDYGEV 
IVCDTYEEML DVANEIASEH VQVMTDRDDW FLENMHSYGA LFLGPRTNVA NGDKVIGTNH 
TLPTRKAGRY TGGLWVGKFM KTHSYQKVLT DEAAAEIGAY CSRLCLLEGF IGHAEQANVR 
VRRYGGRNIG YGGAA