Gene TM1040_3563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3563
Symbol	hisD
ID	4075484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	604396
End bp	605700
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	61%
IMG OID	638005076
Product	histidinol dehydrogenase
Protein accession	YP_611794
Protein GI	99078536
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0867737
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTAT TTCTGACTTC TGCTGAGGCA GACTTCGAAC AATCCTTCAC CACCCTCTTG 
AACGCAAAAC GAGAGGACAG CCCAGATGTG GACGCCGTCG TCGCGGACAT TATTGCGGAT 
GTGCGGGGAC GCGGAGATGC GGCTCTGCTG GAGCTGACGC AGAAATTTGA CCGCCTAGAC 
CTGCCCGATT CGGCAGCGCT GAGAATCACT GCAGAGGAAG TCGACGACGC CATCAAATCC 
GTGTCAGAGG CCGAGCGCGC AGCACTTGAA CTCGCAGCGG ACCGTATTCG TGCCTATCAC 
GCTGAACAAA TGCCAGAAAA CAAGAGCTGG ACGGATGCCG GCGGCGCAAC CCTCGGGTGG 
CGCTGGTCGG CTGTTTCCGC GGCAGGACTC TATGTGCCCG GCGGGCTTGC CAGCTATCCG 
TCCTCTGTGC TGATGAATGC CATTCCCGCC AAGGTTGCAG GAGTCGAACG TCTTGCGGTG 
ACGGTTCCGA CGCCGGACGG GCAGATCAAC CCTCTGGTGC TCCTGGCGTG TCGGGTTTCT 
GGCGTCGACG AAATTTACCG CGTTGGCGGC GCGCAAGCGA TCGCCGCGCT TGCGTATGGG 
ACCGAAACCA TCGCCCCTGT GGATAAGATC ACAGGCCCCG GCAACGCCTT TGTGGCAGCC 
GCCAAGCGGC GCGTATTTGG TAAAGTCGGC ATCGACATGA TCGCTGGGCC CTCCGAGATC 
CTTGTGATCG CGGACAAGGA CAACAACCCA GATTGGATCG CATTGGACCT GCTCAGTCAG 
GCGGAGCATG ACGAAAGCGC GCAATCCATC CTGATCACCG ACGATGCGGA ATTCGGATCT 
GCGGTGGCGG TGGCGGTCGA TAAACGACTG GAAACGCTGG AACGCCGCGC CATCGCCGGC 
GCCAGCTGGC GTGATTTCGG CGCTGTAATC GTAGTGCGTG ACATGGACGA GGCGGCGGCG 
CTTTCCAACC GGATTGCACC CGAGCACCTT GAACTCTGTG TCGCCGATCC CGAAGCGCTG 
AGCAAGAAAA CGATCCACGC GGGCGCAATT TTCATGGGCC AATATACGCC TGAGGCCATT 
GGAGACTACA TCGGCGGGCC AAATCACGTC CTGCCCACGG CGAGGTCTGC GCGCTTCTCC 
TCCGGTCTGT CGGTGATGGA TTTCATCAAG CGCACAACTC TGAGTCAGAT GACCCCCGAC 
GCCTTGCGCA GCATTGGACC AGCGGCGGCG ACGCTGGCCG AGAGCGAGAG CCTCGAAGCG 
CACGGGCTGT CCGTTCTCGC TCGCCTTGAG GCACTCAACC GCTGA

Protein sequence

MPVFLTSAEA DFEQSFTTLL NAKREDSPDV DAVVADIIAD VRGRGDAALL ELTQKFDRLD 
LPDSAALRIT AEEVDDAIKS VSEAERAALE LAADRIRAYH AEQMPENKSW TDAGGATLGW 
RWSAVSAAGL YVPGGLASYP SSVLMNAIPA KVAGVERLAV TVPTPDGQIN PLVLLACRVS 
GVDEIYRVGG AQAIAALAYG TETIAPVDKI TGPGNAFVAA AKRRVFGKVG IDMIAGPSEI 
LVIADKDNNP DWIALDLLSQ AEHDESAQSI LITDDAEFGS AVAVAVDKRL ETLERRAIAG 
ASWRDFGAVI VVRDMDEAAA LSNRIAPEHL ELCVADPEAL SKKTIHAGAI FMGQYTPEAI 
GDYIGGPNHV LPTARSARFS SGLSVMDFIK RTTLSQMTPD ALRSIGPAAA TLAESESLEA 
HGLSVLARLE ALNR