Gene Haur_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3937
Symbol
ID	5735798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4931349
End bp	4933454
Gene Length	2106 bp
Protein Length	701 aa
Translation table	11
GC content	52%
IMG OID	641281088
Product	GAF sensor signal transduction histidine kinase
Protein accession	YP_001546699
Protein GI	159900452
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACGC TTGCTTTATT TAGTAGCCTA GCCCAAACCT TGCTTGCAAC CACACCTTTT 
GAGCAGCGCA TGCAGCATTG TTTTGGGCTG TTGGCGGATA GCTATCCTCA GCTTGATTTA 
CGCTTAACCT TATTAAACGA GCCTGATGCT CGTCCGCAAG TGGTTTTGCC GTTGCATCGT 
ACCAGCGCCG TTTGGGATAA CACTCGCATG ATGCAGGTGG TGCGGCGGCG ACAACCAGTC 
GTGATCGATC AACACACAGC TCCAGCCTTG CCACCCAGCC CGTTTACCAC CAGCGCAATT 
GTTGCTAGCG AATGGCAAGC CGATATGCAA TGTTATTTGG GGCTGCCGAT TCAGTGGGAA 
GGCCGCTTGT GGGGCGTGTT GGAAGCCCGC CGTAATGGTA CATTTAGCGC CAGCGAACGC 
ACCTTATTGA GCAATTTGCT GCCCTTACTG GCCACCGCGA TCGGCGAAGC CCACTGGGGG 
CGACCGATTC ATCATACCAG CAGCGAACAG CAGCTTGATG TACGGGCATT AACCCACGAT 
TTAGAAATTG CGCCTGATGT GACAACGTTG TTGACAACGC TCTTGCAACG GGCCATCCAC 
AGCGTCAAAG CCAGCGCTGG CGCGATTAAC TTGGTTGATC GTGAGCATGG CGAATATCGT 
TTGATTGCCT CGCAAGGCTA CCCGCCAACC GCTGGAATTA GTGAGCGAAC ATCGTGGCCT 
TGGAATGTTG GGGTGGTCGG GCGGGTGGCA CGCACTGGCA AGGCCGCCTT GTTGACCGAT 
ATTGCCCACG ATAGCGAATG GCAACTTTCT ACCCCCGATG TGCGAGCCGA AATCGTCGTG 
CCCGTGCGGG TCGAGGGCGA GGCATGGGCG GTGCTGGTGC TTTCGACCAA TCGTGAGCCA 
ATCTTTACAA CCCGCGATCT TTATTTTATT CAGGCTTTGG CTGATGTGGC GGCGCGGCCA 
TTACAACGGG CAACCAGTTA TAGCGAATTG CTCGAAGCCC GCATGCAATT GCAACAAACC 
TTGGCTAGTT TGCCGCTGGG CTTGGCCTTG ACTGATGGCG AAGGCCGAAT TTTACGCACC 
AATCCCGCCT GGTATCAACT TTGGCAAATT GAGCAGCCCG CCGATGAAAC TGCGCTCTAT 
TTGCCGTGGG ATATTTTGCC CTTGCTGCTC AAACGGCTGT CGCATCCCTT GGAATTGACC 
GATTTTTTTG CTGAATGCCA AGCTCAACCT GACGAAACCC TCGAATTAGC GCTGCGTTTG 
AGCGAACCAC TTCAAGATTT AAAATTGCGT TCAACCCCAG TTAAAGATGC TCAGCACCAA 
ATTACTGGGC GCTTGGTGGT GATTGAAGAT GTGACCCGCG AGCGTGAAAT CGACAAGATG 
AAAAACGAGT TTGTGTCGGT GGTATCGCAT GAATTGCGTA CCCCGCTAAC CTCGATTTTG 
GGCTATACCG AGTTGCTGTT AGCGCGTGAA TTCAAGCCAG TTGAACGTCA AGAGTTCGTC 
CAAACCGTCT ATGATCAGGC CAACCAACTC TCGAAGATGG TCGATGATCT GCTGAATCTT 
TCGCGTTTGG ATGCAGGCCA GATCAAGCTG AATCGTTGGG TGGTGTCGCT GCACCAAATT 
ATTCGTGAAA TTACCAAGCA ACTTAACGAA ACATTGTCTG AAAAGCATCG TTTGTTAATT 
GATATTCCCG AAGGCATTCC GCCAATCTTT GCCGATAAAG ATAAAGTGCG TCAGATTTTG 
ACCAACCTGC TCTCGAATGC GATCAAATAT TCGCCCAATG GCGGCCAAGT AGCCTTGATT 
GTACGTGAAT TGCGTAAAGT TCCGCCTGGT GCGCCGCCCT TGCCCAACGA GCGCTCGGTG 
ATTATTGCGG TGCGCGACCA AGGTATGGGT ATTTCCGAAG AAGATTTGCC CAAGCTGTTT 
ACGCGTTTTT TCCGCGTCGA TAACTCGACG ACTCGCAAAA TTGGCGGCAC AGGCTTAGGC 
TTATCAATCA CCAAGGCCTT GATCGAGTTG CATGGCGGGC GAATTTGGGC CACCAGCACG 
CTTGGCCGTG GCACAACCTT CTGGGTAACC TTGCCAATTG CCACTGAGTT AGCCCGCCGA 
GGATGA

Protein sequence

MSTLALFSSL AQTLLATTPF EQRMQHCFGL LADSYPQLDL RLTLLNEPDA RPQVVLPLHR 
TSAVWDNTRM MQVVRRRQPV VIDQHTAPAL PPSPFTTSAI VASEWQADMQ CYLGLPIQWE 
GRLWGVLEAR RNGTFSASER TLLSNLLPLL ATAIGEAHWG RPIHHTSSEQ QLDVRALTHD 
LEIAPDVTTL LTTLLQRAIH SVKASAGAIN LVDREHGEYR LIASQGYPPT AGISERTSWP 
WNVGVVGRVA RTGKAALLTD IAHDSEWQLS TPDVRAEIVV PVRVEGEAWA VLVLSTNREP 
IFTTRDLYFI QALADVAARP LQRATSYSEL LEARMQLQQT LASLPLGLAL TDGEGRILRT 
NPAWYQLWQI EQPADETALY LPWDILPLLL KRLSHPLELT DFFAECQAQP DETLELALRL 
SEPLQDLKLR STPVKDAQHQ ITGRLVVIED VTREREIDKM KNEFVSVVSH ELRTPLTSIL 
GYTELLLARE FKPVERQEFV QTVYDQANQL SKMVDDLLNL SRLDAGQIKL NRWVVSLHQI 
IREITKQLNE TLSEKHRLLI DIPEGIPPIF ADKDKVRQIL TNLLSNAIKY SPNGGQVALI 
VRELRKVPPG APPLPNERSV IIAVRDQGMG ISEEDLPKLF TRFFRVDNST TRKIGGTGLG 
LSITKALIEL HGGRIWATST LGRGTTFWVT LPIATELARR G