Gene Sare_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3422
Symbol	hisD
ID	5704031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3948474
End bp	3949796
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	72%
IMG OID	641272849
Product	histidinol dehydrogenase
Protein accession	YP_001538215
Protein GI	159038962
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.025652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGAACC GGATCGACCT TCGTGGCGGG GTTCGTGACC CGCGTCGCCT GCTGCCCCGT 
GCCCGGCTCG ATGTCTCCGC GGCCGTCGAG CGGATCCGTC CGCTCGTGGC GGAGGTGCGG 
GAGCATGGCT ATCCGGCGAT CCGGGCGGCG AGCGAACGTT TCGACGGGGT GTCCCCGGCG 
GTGCTGCGGG TGCCGGCCGA GATGGTCGCC GAGGCCGAGG GGACGCTCGA TCCGCAGGTC 
CGTGCCGCGT TGGTGGAGTC GATCGACCGG GCCCGCCGGG TGCACGCCGC CCAGCGCCGA 
AGCGACCACA CCACGCAGGT CGTGCCGGGC GGCACGGTCA CCGAGCGCTG GTTGCCGGTC 
GACCGGGTCG GCCTCTACGT GCCCGGCGGT CTGGCGATGT ACCCGTCGAC GGTGGTGATG 
AACGTGGTGC CCGCGCAGGA GGCCGGGGTG CGTTCGTTGG TCGTGGCCAG TCCACCGCAG 
AAGGACAACG GTGGCTGGCC CGACCCGCGG GTGCTCGCCG CCTGTGCTCT GCTCGGCGTG 
GATGAGGTGT ACGCCGTCGG CGGCGCGCAG GCGGTGGCGA TGCTGGCATA CGGCAGTTCG 
GTTGACCCCG ATGGCGCCAC CCGCTGCGAT CCGGTCGACT TGATCACTGG CCCCGGCAAC 
ATCTGGGTCA CCGCCGCCAA GCGGCTGCTG CGGGGTGTGG TGGGCATCGA CGCCGAGGCC 
GGCCCCACCG AGATCGCGAT ACTGGCCGAC CACACCGCCG ATCCGGTGCA CGTGGCCGCT 
GACCTGATCA GCCAGGCCGA GCACGACCCG CTCGCGGCGA GCGTGCTGGT CACGCCGTCG 
ATGGAGCTGG CCGACGCGGT GGACCGGGAG CTGACCCGCC AGGTCGCGGC GGCCAAGCAC 
ACCGAGCGGA TCGGCACGGC GCTCACCGGT GAGCAGAGCG GCATCGTGCT CGTTGATGAC 
CTGGCGGCGG GGCTGCGGGT GGTTGACGCG TACGCGGCCG AGCATCTGGA GATTCAGACC 
GAGAACGCCC GCGAGTGGGC GCTGCGGGTA CGCAACGCCG GGGCGATCTT CGTCGGTGCC 
TGGTCGCCGG TGTCGCTTGG TGACTACTGC GCCGGCTCCA ACCATGTACT GCCCACCGGT 
GGGTGCGCCC GGCACTCGTC GGGCCTGTCG GTGCAGTCCT TCCTGCGCGG TGTTCACCTG 
GTGGAGTACA CGCGGGATGC TCTGCGGGAG GCGGCGCCGC ACGTGGTCGC CCTGGCGACG 
GTGGAGGACC TGCCGGCGCA CGGCCAGGCG GTGTCCGTCC GGCTGCCGGG GGAGGCGTCG 
TGA

Protein sequence

MLNRIDLRGG VRDPRRLLPR ARLDVSAAVE RIRPLVAEVR EHGYPAIRAA SERFDGVSPA 
VLRVPAEMVA EAEGTLDPQV RAALVESIDR ARRVHAAQRR SDHTTQVVPG GTVTERWLPV 
DRVGLYVPGG LAMYPSTVVM NVVPAQEAGV RSLVVASPPQ KDNGGWPDPR VLAACALLGV 
DEVYAVGGAQ AVAMLAYGSS VDPDGATRCD PVDLITGPGN IWVTAAKRLL RGVVGIDAEA 
GPTEIAILAD HTADPVHVAA DLISQAEHDP LAASVLVTPS MELADAVDRE LTRQVAAAKH 
TERIGTALTG EQSGIVLVDD LAAGLRVVDA YAAEHLEIQT ENAREWALRV RNAGAIFVGA 
WSPVSLGDYC AGSNHVLPTG GCARHSSGLS VQSFLRGVHL VEYTRDALRE AAPHVVALAT 
VEDLPAHGQA VSVRLPGEAS