Gene Haur_4364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4364
Symbol
ID	5736224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5575793
End bp	5577868
Gene Length	2076 bp
Protein Length	691 aa
Translation table	11
GC content	53%
IMG OID	641281525
Product	shikimate/quinate 5-dehydrogenase
Protein accession	YP_001547124
Protein GI	159900877
COG category	[R] General function prediction only
COG ID	[COG5322] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0103685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAG TAGTCTGTAT CACGCTCGGA CGTTCGCGGC GTGACTTTAG CTTTACAACA 
ACGCTGTTGG GCGAAGAGCT ACGGGTGCGC CGCATTGGAG CCGATGGCGA TGTCGAACGG 
GTCAAGCAGT TGATTCGTGA GCACGATGGC AAGGTTGATG CGATTGCGCT TGGTGGTGTA 
ATTGCCAACT TTCGGGTTGG CAAGGCCAGC TATCAACATA ACCAAGCGTA CACCATCGTC 
AATCAAGCAC GAGTTACGCC AACCGCCGAT GGAGTGTTGC TCAAGGCAAC CCTCGAACGT 
TGGACGGTGG CGCAGGCGGT TTCGCGTGAA CCAGGCCGCT TCAACTATCG TCGGGTTTTG 
GTCTTTTCGG GGATTGAGCG CTATTCTTTA GCTGAATCGC TCAGCGGTTA TAACGTTGAT 
TTGCGTTTTG CCGACCCCAA GGTGCATTAT GGTTTGCCCT TCACGTTGAG TTCGCTGAGC 
CAACTGGAGC GCTACGCCAA ATTTGCCATG CCCGATTTGG CCAAAAAGCC CTATCGGCGG 
ATTCACCCGA TTGGCAAGGG CGCGACCCAC GATAGCCGTC TCGAAAAAGA TTGTGCTTGG 
GCCGATGTGT TAGCTGGTGA TTTTGCCTTT ATTCGGCGCT ACGCCCCGCA AGATCTGCGA 
GGTCGCACGA TTTTGACCGA CGATCCATCG CCTGCTGAAA TTGAAGATTT GCGCCAGCGT 
GGAGCACATA CCTTAATTAC GCTCACGCCC AAAATTAGCG AAGAACATCC GTTTGTTTCG 
GCAGATGTGC TCGAAGCTAT GATTTTGGCC GTTACAGGCA AGCGCACGCT TGATGAAGCC 
ACGGTATTGC AAATTACCGC CGATGCTAAT TGGGAGCCGC ACATCCAGCG TTTGACCAAC 
GACGAAGAAT TAGAAAAATT TGCCTTTGTG ATTCACCCGC TCTCAACCAA ATTTATTTAT 
AAAGATCCCC GCTTCAAAGT CTTCAAATTT GTGCCCCAAC GTTGGGTTGA ACGCGCCATG 
GCCCACTTGC CACCGCTGTA TCTCTCGCGT ATGAAGGGTA TTAAATCAAC TGGTACAGGC 
AAAGAAATCG AAGGCATTTT GCTGACCTTG GGCGCTACGC CCCGCGAATT GATGCGCCGC 
CCAACTGCCT TTACCTATCG CCGTTTGATC AAGGCTGCCC GTATGGCCGA GCGCATGGGC 
GCGAAGCTGA TGGGCTTGGG GGCATTCACT TCGGTGGTTG GTGATGCTGG CATCACGGTT 
GCCCAAAAAT CCGATATTGG CATCACCTCA GGCAACTCGT TGACTGTGGC CGCCACCCTT 
GAAGCCGCCA AACAAGCGGT CATTCTTATG GGTGGTCGAG TTGATCAAGG CACGGCAGTG 
GTGATTGGGG CAACTGGTTC GATTGGCGCA GTTTGTTCGC GCCTGCTAGC CCAAGCGATT 
GGCGATGTGG TTTTGATTGC GCCACGACCT GAGCGTTTGA TCGCCTTGAA AAAGCAAATC 
GAGGCTGAAA CGCCCAACGC CAAAGTAACA ATTGCCACCA AAGCTGATGA TTATGTTGGC 
AGTGCCGACT TAATTGTTAC CACCACCACC GCCCTCAACA CCAAAATTGT CGATATTGAG 
CGCTTGAAGC CAGGTGCGGT GGTGTGTGAT GTGGCACGGC CACCCGATAT CAAAGAAGAT 
GAAGCCGCCA AACGCCCTGA TGTGTTGGTG ATTGAATCGG GCGAAATCAC CTTGCCAGGC 
GAGGTTGATT TTGGCTTTGA TATTGGTTTG CCGCCAGGTA CAGCCTATGC ATGTCTCTCG 
GAGACGGCTT TGTTGGCGCT TGATGGCAAG TTTGAAGATT ACACGCTTGG CCGTAATATC 
GAAATGGATC GGGTCAAGGA GATGTATCGC TTGTTCAAAA AGCATGGCCT CAAATTGGCT 
GGCCTGCGCA CCTTCGACCA ATATGTAACC CCCGAAATGG TCGCCGAAAA GCGCCGATTG 
GCCGATCATC GTCGGCACGA GCTGGGCTTG CCAGTGACCA CCGAAAGCGA AACCCTTACT 
AGCGAAATGC CGCTGGAAGT CGGTGGCTCC AACTAA

Protein sequence

MKEVVCITLG RSRRDFSFTT TLLGEELRVR RIGADGDVER VKQLIREHDG KVDAIALGGV 
IANFRVGKAS YQHNQAYTIV NQARVTPTAD GVLLKATLER WTVAQAVSRE PGRFNYRRVL 
VFSGIERYSL AESLSGYNVD LRFADPKVHY GLPFTLSSLS QLERYAKFAM PDLAKKPYRR 
IHPIGKGATH DSRLEKDCAW ADVLAGDFAF IRRYAPQDLR GRTILTDDPS PAEIEDLRQR 
GAHTLITLTP KISEEHPFVS ADVLEAMILA VTGKRTLDEA TVLQITADAN WEPHIQRLTN 
DEELEKFAFV IHPLSTKFIY KDPRFKVFKF VPQRWVERAM AHLPPLYLSR MKGIKSTGTG 
KEIEGILLTL GATPRELMRR PTAFTYRRLI KAARMAERMG AKLMGLGAFT SVVGDAGITV 
AQKSDIGITS GNSLTVAATL EAAKQAVILM GGRVDQGTAV VIGATGSIGA VCSRLLAQAI 
GDVVLIAPRP ERLIALKKQI EAETPNAKVT IATKADDYVG SADLIVTTTT ALNTKIVDIE 
RLKPGAVVCD VARPPDIKED EAAKRPDVLV IESGEITLPG EVDFGFDIGL PPGTAYACLS 
ETALLALDGK FEDYTLGRNI EMDRVKEMYR LFKKHGLKLA GLRTFDQYVT PEMVAEKRRL 
ADHRRHELGL PVTTESETLT SEMPLEVGGS N