Gene Haur_4708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4708
Symbol
ID	5736944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6014131
End bp	6015702
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	54%
IMG OID	641281872
Product	histidine kinase
Protein accession	YP_001547467
Protein GI	159901220
COG category	[G] Carbohydrate transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG1129] ABC-type sugar transport system, ATPase component [COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTACCT GCCGCCATAT TTCCAAGCAA TTTGGTACGC TGCCCGTGAT CGATGAGGTC 
AGCTTTGATC TTGCGCCTGG CGAGGTGGTG GGCTTGACTG GCCAAAGTGG TGCTGGTAAA 
TCGGTATTGG TGCGTTTATT GGCGGGCTTG GAAAAACCCG ATACTGGGGT GATTTCGACC 
CGTGGCCAAT TAATTAACTC GACCCAAAGT GCCTTTCGGG CTGGGTTGGC GGTCATCCAT 
CAGCAGCCAG TGCTAGTTGA GCATTTGGAT GTGGCGAGTG CGATTTTTTT GGGTCACGAG 
GTTGGGCGCG GTTGGCTGGG TTGGTTATCG TTGCCCAATC AGCGCCATCA CGACACCATG 
GCGCGGCAAA TTCTAGCCCA ACTTGGTTTA GAGTTGCCAT CGTTGCGCAC CTTAGTTCGT 
AATTTATCGA GCGAACAACG CCAGATGTTG GCGATTGCGC AGGTGCTGAT CCGCAAGCCG 
CAAGTTGTGA TTATCGATGA GCCAACGCCG CTACTGCGCT ACGAATATCA ACAAACGCTG 
CTCGAATTGA TTCGCGAATG GCAAGCGCAA GGTGTGGCGG TGCTGTTTAG CAGCCAAAAT 
CTTGATCATC TATTTGCAGT GAGCAATCGG ATTTTGGTGT TGCGGCGCGG GCGCTTTGTG 
TTCGAGGCGG CCACCGAAAA AACCTCGCGT GAGGAAGTGG TGCGGGCACA AATTGGAGCG 
CGAGATCAGC AACATCTCAC ACCAATTATT TGGGCCTTGG AAAATTACCA TCGTGCCAGC 
CAACAAGCCG AGGCCTTGCG CCAAAGCCAA TCCAGCCTAG AGCACGATTT AGCTAGCCAG 
AATCAGCTTA ATCGCCAATT GATTGGCCAA CTCGATCAAC AGGTCAGTAA TCTTGATCGC 
GCCAATGCGG CCTTGCAAGA AGCCCAACGT CGTTTGCTTT CCGAGCGCGA AGGTGAGCGC 
AAAGTGCTTG CCCGCGAGCT GCACGACCAA GTTATTCAAG ATTTGGTGAG CCTCAATTAT 
GATATTGATA ATTTGCGCAG CCAAATTGAC GACCCTGAGC AAGCCAGCCT TGGGCTTGAC 
GATTTGCGCG ATAACATTCG CCAATTGGTG AGCACAGTAC GGGCAATTTG TGGTAACTTG 
CGCCCGCCAA CCATCGATAG CCTTGGGGTC AATGCGGCAA TTCAATCGTT TGTGCGCGAT 
TGGAGCAGCC GCAGCGGCAT TGAAGTGCAG CTTGATCTCG ACGACGATTT AGAGCGCTTG 
CCCGAAATGC TCGAAATTTC GGCCTTTCGC ATGATTCAAG AGGGCTTGAG CAATGTGCGT 
AAACATGCCC AAGCCACCAA AGTTGGCATT AGCCTGCGTA CCACCGCCCG CCGCACTCTG 
CTCCTGACGA TTGCCGACAA CGGGCGCGGC TTGCAAGCTG AGATTAATTT GGCGGCGCTG 
GCGAATGCAG GCCACTATGG GTTGCTGGGC ATGAGCGAAC GGGTGGCGCT GGTTGGCGGG 
CGTTTCCGCG TGCACAATCG GGCTGGCGGC GGTCTCATCC TCGAAATCGA AATTCCCTAC 
CAACCACTTT AA

Protein sequence

MFTCRHISKQ FGTLPVIDEV SFDLAPGEVV GLTGQSGAGK SVLVRLLAGL EKPDTGVIST 
RGQLINSTQS AFRAGLAVIH QQPVLVEHLD VASAIFLGHE VGRGWLGWLS LPNQRHHDTM 
ARQILAQLGL ELPSLRTLVR NLSSEQRQML AIAQVLIRKP QVVIIDEPTP LLRYEYQQTL 
LELIREWQAQ GVAVLFSSQN LDHLFAVSNR ILVLRRGRFV FEAATEKTSR EEVVRAQIGA 
RDQQHLTPII WALENYHRAS QQAEALRQSQ SSLEHDLASQ NQLNRQLIGQ LDQQVSNLDR 
ANAALQEAQR RLLSEREGER KVLARELHDQ VIQDLVSLNY DIDNLRSQID DPEQASLGLD 
DLRDNIRQLV STVRAICGNL RPPTIDSLGV NAAIQSFVRD WSSRSGIEVQ LDLDDDLERL 
PEMLEISAFR MIQEGLSNVR KHAQATKVGI SLRTTARRTL LLTIADNGRG LQAEINLAAL 
ANAGHYGLLG MSERVALVGG RFRVHNRAGG GLILEIEIPY QPL