Gene Haur_3062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3062
Symbol
ID	5734934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3868307
End bp	3869683
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	52%
IMG OID	641280206
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001545828
Protein GI	159899581
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC AACGAAAATT ATTATTAACC CACATCGCAG TTGCCCTCGT TGCAATTTTG 
CTGATTACGG CGGTGGCCAA CTTCACCGTC AATCGCTATT TTAGCGATCT TGCGGCCAAA 
CAGGCCAAAC AAGCAGCCCA AGAGTTTGCG CCAACCTTGG CAACCTGCTA CCAAATTATT 
GGCAGCTGGG ATTTTAATGG CCAGCGTTGT ATGCAGCTTG GGCCACGACC GTTCATGCCG 
CCGCAATTTC GCCATGTCGT GGTAGTTGAT ACCGCTGGTG AGATTGTTTT TGATAGCCGT 
GGACGCGGCC AAATTAATAA ACCAACCAAC ACCATTACCC AACGCGATAT TGAACGTGGC 
GAATCAATTA ATGCTGAAGA TGGCACGGTG ATTGGCACGG TGATTGTGCG ACCCAATCAA 
GGCCAATTTG GCGCAGATGA AGATTATTTT TTGAGTATGG TGCGGCGTAA TATTTGGTTG 
GCCGGAGCAA TTACCGCCCT CTTAGCCTTG GCTATTGGCA TCGGCCTGGC GCGAACCTTG 
GCCGCGCCGT TGCGCAGCCT GACTGCCGCC GTGCATCAAC TGGCTCAGGG CGAACGTTCA 
GTTCAAGTTG ACGATTCGGG CAACGATGAA ATTGCCGAAT TAAGCCAAGC CTTTAACACC 
ATGAGCAGCG AACTGCATCG CTCTGAGCAA GTGCGCCGCC AGATGGTTGC CGATATTGCT 
CACGAATTGC GTACCCCTTT GAGCGTGCTG CAAATTGAGC TTGAAAGCAT CGAGGATGGC 
GTGAGCAAGC CCACACCGGC GGTGATTAGC TCCTTGGGCG AGGAAGTACA ACAACTTAAT 
CATCTGATTG AAGATTTACG CACACTTTCC TTGGCCGATG CAGGCCAGTT GACTCTCAAT 
CCAATTGAGC TAGAACCCCA AGATGTGGTC AATCGTGCGG TCAATCGTAT GCAGTTGGCG 
GCACGCGAAA AACAATTGGA GCTAGCCAAC GATAGCGCCG AACAGATCGA TTTGGTCCAT 
GCTGATCCAT CACGCCTACA ACAAGTGCTG GTTAATCTTT TGCAAAATGC CGTTCGCTAC 
ACCCCGCAAG GTGGTAAAAT TCGCGTGACC GCCCGCCAAA GTGCTGGTGA AGTTATTTTG 
GGTGTTCACG ACACTGGTGC AGGCTTCGAC CCAACCGAGG CTGCCACGAT CTTCGAGCGC 
TTTTATCGCA CCGATAAAGC CCGCGCTCGT GATACGGGCG GCACAGGCTT GGGCTTGGCA 
ATCGTCAAAG GTCTCGTGAC CGCAATGGGT GGCCGGGTTT GGGCAACCAG TGTGCCGAAC 
CAAGGTTCAA GTTTCTATGT TGCTTTACGA GCAATCAGCA CCAAGGAGGG TGTATGA

Protein sequence

MKLQRKLLLT HIAVALVAIL LITAVANFTV NRYFSDLAAK QAKQAAQEFA PTLATCYQII 
GSWDFNGQRC MQLGPRPFMP PQFRHVVVVD TAGEIVFDSR GRGQINKPTN TITQRDIERG 
ESINAEDGTV IGTVIVRPNQ GQFGADEDYF LSMVRRNIWL AGAITALLAL AIGIGLARTL 
AAPLRSLTAA VHQLAQGERS VQVDDSGNDE IAELSQAFNT MSSELHRSEQ VRRQMVADIA 
HELRTPLSVL QIELESIEDG VSKPTPAVIS SLGEEVQQLN HLIEDLRTLS LADAGQLTLN 
PIELEPQDVV NRAVNRMQLA AREKQLELAN DSAEQIDLVH ADPSRLQQVL VNLLQNAVRY 
TPQGGKIRVT ARQSAGEVIL GVHDTGAGFD PTEAATIFER FYRTDKARAR DTGGTGLGLA 
IVKGLVTAMG GRVWATSVPN QGSSFYVALR AISTKEGV