Gene Syncc9605_2070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2070
Symbol	hisD
ID	3735801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	1893384
End bp	1894691
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	67%
IMG OID	637776656
Product	histidinol dehydrogenase
Protein accession	YP_382365
Protein GI	78213586
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCAGC CGGCCGTTGC TCCCCTTCGC ATCGTGCGGG ATCTGGACCG GGCCCAGACG 
GAGCTGAAAC GGTTGTCGAG CCGCACCACG CAAACCCAGC AGGGTGAAGC CCGTGAGCGG 
GTTGAATCCA TTCTCGCAGC GGTGCGCGAC CGCGGTGATG CCGCCATTGC CGACTACACC 
GAACGGTTCG ATGGCTTCCG GCCCGAACCG ATGGCGGTGT CGCCCGAGGC CCTCGAACAG 
GCCTGGACGT CGCTGCCGAC CAACCTGCGG GATGCCCTAG AGCTGGCCCA TCGCCGCATC 
ACCGACTTCC ACCAACGCCA ACGTCCCGCC GATCTGGCGG TGACGGGCCC CCATGGCGAA 
CAGCTTGGGC GGCGCTGGCG ACCGGTGGAG CGGGCGGGTC TCTACGTGCC CGGAGGACGG 
GCGGCCTACC CCAGCACCGT GTTGATGAAT GCTGTTCCAG CCCGGGTCGC CGGCGTCAAA 
AACGTGGTGA TCTGTTCCCC CGCTGGACGT GATGGTGCGG TGAACCCCGT GGTACTGGCA 
GCGGCCCACC TGGCCGGCGT GAAAACGGTG TTCCGCCTCG GAGGTGCCCA AGCTGTCGCC 
GCCATGGCCT ATGGCAGCGA GAGCGTTCCC AAGGTGGACG TGATCAGTGG CCCCGGGAAC 
CTCTACGTCA CCCTGGCGAA ACAGGCGGTG TACGGCCAGG TGGCCATCGA TTCCCTGGCG 
GGACCAAGCG AAGTGCTGGT GATCGCAGAC CACTCCGCCA AGCCCGATCA GGTGGCAGCG 
GATCTGTTGG CGCAGGCGGA GCACGACCCC CTGGCGGCTG CGGTGCTGAT CACCACCGAC 
CCTGCACTGG CCGACGGGAT CAACGCCGCA GTGGCCGAAC AGCTGGCCGA TCACCCCCGC 
CAGGAGATCT GCGAAGCCGC TTTGCGGGAC TGGGGGCTGG TGGTGGTCTG CGACGACCTT 
GAAAGCTGTG CCCGCCTCAG CGACAGCTTC GCTCCCGAAC ACTTAGAGCT GCTGGTGGAG 
CGGCCCGAGC CCCTGGCGGA TCGCATTCAG AACGCCGGAG CCATTTTCCT AGGCCCCTGG 
TCTCCAGAAG CCGTGGGGGA TTACCTGGCA GGCCCGAACC ACACGCTGCC CACCTGTGGA 
GCCGCGCGTT TCAGCGGAGC CCTGAGTGTT GAGACCTTCA TGCGCCACAC CTCGCTGATC 
GGTTTCAACC GGGCTGCCCT AGAAGCAACG GGTTCAGCTG TGCAGGAGCT GGCCACCAGT 
GAAGGCCTGC ACAGCCACGC TGAGTCGGTG CGGCGGCGCC TCAGCTGA

Protein sequence

MSQPAVAPLR IVRDLDRAQT ELKRLSSRTT QTQQGEARER VESILAAVRD RGDAAIADYT 
ERFDGFRPEP MAVSPEALEQ AWTSLPTNLR DALELAHRRI TDFHQRQRPA DLAVTGPHGE 
QLGRRWRPVE RAGLYVPGGR AAYPSTVLMN AVPARVAGVK NVVICSPAGR DGAVNPVVLA 
AAHLAGVKTV FRLGGAQAVA AMAYGSESVP KVDVISGPGN LYVTLAKQAV YGQVAIDSLA 
GPSEVLVIAD HSAKPDQVAA DLLAQAEHDP LAAAVLITTD PALADGINAA VAEQLADHPR 
QEICEAALRD WGLVVVCDDL ESCARLSDSF APEHLELLVE RPEPLADRIQ NAGAIFLGPW 
SPEAVGDYLA GPNHTLPTCG AARFSGALSV ETFMRHTSLI GFNRAALEAT GSAVQELATS 
EGLHSHAESV RRRLS