Gene Syncc9902_0602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_0602
Symbol	hisD
ID	3742644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	-
Start bp	607811
End bp	609151
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	59%
IMG OID	637770773
Product	histidinol dehydrogenase
Protein accession	YP_376614
Protein GI	78184179
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGGGGAA TGAACCCAAA TCGTTCCTTG CCTGAGAAGA GTCCGGCGGG TTTTTCACTC 
CGCATCGTGC GAGATCCGGA GCAGGCCAAA GGAGAACTCC AGCGCCTCGT CCAACGGACG 
GCTCATGCCC AACAACGAGA TGCACAGTCA CGTGTGGACA CGATTCTGTC CGAAGTCCGA 
GCCCGGGGGG ATGCCGCAGT TGTCGAATTC ACAGAGCGCT TTGACGGCTT CCGTCCAAAT 
CCGGTCGCTG TTCCCCAGGA GCAGCTCGAG CGTTCATGGC GCAACCTGCC GGCCAACCTT 
CAGGACGCCC TAGAGCTCGC GCATCGGCGC ATCACCGACT TTCATCAACG TCAGCGGCCA 
TCGGATATCG CCACCGAGGG GCCCTATGGA GAACGGCTTG GACGCCGCTG GAGGCCGGTG 
GATCGAGCTG GTTTATACGT GCCAGGAGGT CGAGCCTCGT ATCCCAGCAC AGTCTTGATG 
AATGCTGTAC CAGCGAAGGT TGCTGGGGTC AAAGAGGTTG TGATCTGTTC GCCGGCAGGT 
CGCGACGGAA CGGTCAATCC GGTGGTTCTC GCGGCCTCGC ATCTCGCAGG GGTTCGAACC 
GTCTTTCGCC TTGGTGGGGC CCAAGCGATC GCAGCTATGG CCTACGGAAC AAACAGCGTT 
CCCAAGGTGG ACGTGATCAG CGGACCTGGA AATCTCTACG TCACCTTGGC CAAACAAGCT 
GTCTATGGCC AAGTGGGCAT CGACTCCCTG GCGGGGCCTA GTGAAGTTTT AGTGATCGCT 
GATCAAAGCG CCAAACCTGA TCAAGTTGCC GCAGACCTGT TAGCCCAAGC CGAGCATGAT 
CCGCTCGCCG CTGCGGTTCT GATCACCACC AATCCAGCCT TGGCTGAGCA GATTCCCCAT 
GAAATCGAGC AACAACTCGA GGGGCACCCG CGCCGCGAAA TCTGCGAGGC CTCAATCAGC 
AACTGGGGGT TGGTGGTGGT CTGCGACGAC CTCGAAAGCT GCGCCGAGTT GAGCGACAGC 
TTCGCTCCAG AGCATTTGGA ACTGTTGGTG GAACGTCCCC AGGCGTTGGC TGAACGGATC 
CAACATGCCG GTGCCATTTT TCTGGGCCCT TGGTCACCGG AGGCGGTTGG TGATTATTTA 
GCCGGTCCGA ATCACACCCT GCCCACCTGT GGCGCAGCTC GTTTTAGTGG AGCCCTAAGT 
GTTGAAACAT TCATGCGTCA CACGTCTTTG ATCGGTTTTA ACCGCGCGGC CCTTGAAGCC 
ACAGGATCAG CTGTTCAAGA ACTGGCGACG AGCGAAGGAC TCCATAGCCA TGCCGAATCC 
GTAAGGCGTC GGCTCAACTA A

Protein sequence

MRGMNPNRSL PEKSPAGFSL RIVRDPEQAK GELQRLVQRT AHAQQRDAQS RVDTILSEVR 
ARGDAAVVEF TERFDGFRPN PVAVPQEQLE RSWRNLPANL QDALELAHRR ITDFHQRQRP 
SDIATEGPYG ERLGRRWRPV DRAGLYVPGG RASYPSTVLM NAVPAKVAGV KEVVICSPAG 
RDGTVNPVVL AASHLAGVRT VFRLGGAQAI AAMAYGTNSV PKVDVISGPG NLYVTLAKQA 
VYGQVGIDSL AGPSEVLVIA DQSAKPDQVA ADLLAQAEHD PLAAAVLITT NPALAEQIPH 
EIEQQLEGHP RREICEASIS NWGLVVVCDD LESCAELSDS FAPEHLELLV ERPQALAERI 
QHAGAIFLGP WSPEAVGDYL AGPNHTLPTC GAARFSGALS VETFMRHTSL IGFNRAALEA 
TGSAVQELAT SEGLHSHAES VRRRLN