Gene Cyan8802_3453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3453
Symbol
ID	8392789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3525273
End bp	3526565
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	46%
IMG OID	644981387
Product	histidinol dehydrogenase
Protein accession	YP_003139113
Protein GI	257061225
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.57313
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGAA TTATCACTCA ATCTGCTGAG GTACACACCG AACTGCAACG AATCCGCCAT 
CGGATTTACG ATGATGCGAT TCAACAACAA GAAGCAGCCG TCAAAAAAAT TCTAGAAACC 
GTCAAGGATC GAGGCGATTT AGCCTTTCTA GAGGATTTGG AGCCACCTTT AAACCCAAAA 
CAGTTACGGG TTAGTGGTTC GGAACTAGAC GCGGCCTATC AGCAAATTTC TAAGGACTTA 
CTCGATGCCA TTCGAGTCGT CTGTCAACAA CTCAAGTCCT TTCATCAGCA ACGTCTCCCC 
AAATCTTGGG TTAAATTTGA AGAAGATGAG GTTGTCATCG CTAAGCGGTA TGCCCCCCTC 
AAACGCGCTG GACTTTATGT AGCAGGCGAT CGCGGTTCCC ATATCAGTCG GGTACTCATG 
CAGGCCATTC CAGCCCAAGT TGCCCAAGTA CCCCAAATTG TTTTAGTTAC CCCTCCTGAT 
GCCACCGGAA AAATTCATCC AAATATTTTG GTAGCCGCTC AAGAAGCGGG GGTTCAGGAG 
ATTTATCGTT TAGGGGGGGC GGCTGCTATT GCGGCTTTAG CCTATGGCAC AGAAAGTCTA 
CCGAAGGTTG ATGTCATTAC AGGAACGGGA GATCTAGAGA TAACGTTAGC CAAAAAAATG 
GTTTATGGAA CGATAGCCTT AGATACCACT GTTCAATCCT CAGATTTGAT GATTATTGCA 
GATCGTCAGG CTAATTCAAC CCAAATTGCT GCGGATTTAT TAGCGCAAGT AGAACAAGAT 
CCCACCACCG CTATTGTTCT ACTTACCCCA GATTTTGGCT TAGCAGAAGC GGTTCAAGAG 
CAGGTTTTAC AGCAATTACA GCAATATTCT CCAAGCATTC TGACGGAAAA AGCGATCGCC 
CACTATGGGT TAATTATCGT GGTAGACTCC CTAGGACAAG CGATCGCCCT TGCTAATCAG 
TTTGTTCCTC AATATCTCAT GTTAGCCATG GCCGAACCGT GGGATTTTGT TGACCAAATT 
CGCCATGCTG GGACGATTTT GATGGGTTCA GCTACCCCTA AAGCGATCGC TGATTATTTG 
GGAAATTCTG GGATGATTTT ACCGCCTTCT GGCATAGTCC GCTACGCTTC TACGTTGGGA 
GTAGAAACCT TCCTTAAACC TTCTAATCTC ATCCAATATT CCCCAACATC CTTGAAAAAA 
CTCTCGGATA CTCTCCAATT ATTAGCCGAA GCAGAAGGCT TTTTGGCTAA TACTGAGGCT 
ATTCGTCTTA GATTTAAAGG GGAAAGTGGA TGA

Protein sequence

MLRIITQSAE VHTELQRIRH RIYDDAIQQQ EAAVKKILET VKDRGDLAFL EDLEPPLNPK 
QLRVSGSELD AAYQQISKDL LDAIRVVCQQ LKSFHQQRLP KSWVKFEEDE VVIAKRYAPL 
KRAGLYVAGD RGSHISRVLM QAIPAQVAQV PQIVLVTPPD ATGKIHPNIL VAAQEAGVQE 
IYRLGGAAAI AALAYGTESL PKVDVITGTG DLEITLAKKM VYGTIALDTT VQSSDLMIIA 
DRQANSTQIA ADLLAQVEQD PTTAIVLLTP DFGLAEAVQE QVLQQLQQYS PSILTEKAIA 
HYGLIIVVDS LGQAIALANQ FVPQYLMLAM AEPWDFVDQI RHAGTILMGS ATPKAIADYL 
GNSGMILPPS GIVRYASTLG VETFLKPSNL IQYSPTSLKK LSDTLQLLAE AEGFLANTEA 
IRLRFKGESG