Gene Smed_0208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0208
Symbol	hisD
ID	5321039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	235116
End bp	236420
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	65%
IMG OID	640789142
Product	histidinol dehydrogenase
Protein accession	YP_001325902
Protein GI	150395435
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCAATCA GGCTGAACTA TCTCGATACC GGCTTTGAGC GCGATTTCGC CGCATTCCTG 
ACGACCAAGC GGGAAGTTTC CGAAGACGTA AACGCCGTCG TGCGCGACAT TATCGACGAT 
GTCCGCGCGC GCGGCGATGC GGCGCTTGCA GATTATTCGG CGCGTTTTGA CGGAATAGAC 
TTCAATGTCA CGGGCATGGC GGTGACGGCG GCGGAGATAG ATGCGGCGAT CCACGCCGTT 
GCTCCGGAGG TTCTCGGCGC CCTGAAGGTC GCCGCGACCC GCATCGAGGC GCATCACCGG 
CGGCAATTGC CGAAGGACGA CATCTATGAA GACCAGATGG GCGTCGGCCT CGGCTCCCGC 
TGGACGCCGA TCGATGCGGT GGGCCTCTAT GTTCCGGGTG GCACGGCGAG CTATCCGAGC 
TCGGTTCTGA TGAACGCTCT GCCGGCAAAG GTCGCCGGCG TCCCCCGCAT CGTCATGGTC 
GTGCCGGCAA TGGGCGGTGC GGTCAATCCT GCGGTGCTTG CGGCGGCGCG GCTCGCCGGC 
GTGGAAGAAA TCTATCGCAT CGGTGGTGCC CAGGCCGTCG CGGCCCTTGC CTACGGGACC 
GGGACGATCG CGCCGGTGGC CAAAATCATG GGCCCCGGAA ACGCCTATGT CGCGGCCGCC 
AAGCGACAGG TTTTCGGCAC CGTCGGCATC GACATGATCG CCGGACCTTC GGAAGTGCTG 
GTGATTGCGG ATCGCGACAA CGATCCGGAT TGGATCGCCG CGGACATGCT TGCTCAGGCA 
GAGCACGATG CCGGCGCTCA GGCGATCCTG ATCACCGACG ATGCCGCTTT CGGCGATGCA 
GTCGAAGAGG CTGTGGAGCG TCAGTTGAAG ACGCTGCCGC GTGCCGACAC GGCGGCAGCG 
AGCTGGCGCG ATTTCGGTGC CATCATTCTG GTTCCGGATT TCGACAAGGC CATCCCGCTC 
GCCAACCGCA TCGCTCCCGA ACATCTCGAA CTGGCGACGG CCGATCCGGA CGCGATGGTC 
CCCGCCATCC GCAATGCCGG CGCGATCTTC ATCGGCAGGC ACACGCCCGA AGTCATCGGC 
GATTATGTGG GCGGTTCCAA CCACGTGCTG CCGACGGCGC GTTCGGCGCG CTTCTCGTCC 
GGCCTCGGCG TGCTCGACTA TATGAAGCGA ACGTCTATCC TGCGGCTCGA TCCGGAACAG 
TTGCGCATAC TCGGCCCCGC CGCGATCGCG CTGGCGAGAT CGGAAGGGCT CGAGGCTCAC 
GCCCGATCGG TCGCAATCCG CCTCAACCTC GGGGAAAAGG GATGA

Protein sequence

MAIRLNYLDT GFERDFAAFL TTKREVSEDV NAVVRDIIDD VRARGDAALA DYSARFDGID 
FNVTGMAVTA AEIDAAIHAV APEVLGALKV AATRIEAHHR RQLPKDDIYE DQMGVGLGSR 
WTPIDAVGLY VPGGTASYPS SVLMNALPAK VAGVPRIVMV VPAMGGAVNP AVLAAARLAG 
VEEIYRIGGA QAVAALAYGT GTIAPVAKIM GPGNAYVAAA KRQVFGTVGI DMIAGPSEVL 
VIADRDNDPD WIAADMLAQA EHDAGAQAIL ITDDAAFGDA VEEAVERQLK TLPRADTAAA 
SWRDFGAIIL VPDFDKAIPL ANRIAPEHLE LATADPDAMV PAIRNAGAIF IGRHTPEVIG 
DYVGGSNHVL PTARSARFSS GLGVLDYMKR TSILRLDPEQ LRILGPAAIA LARSEGLEAH 
ARSVAIRLNL GEKG