Gene Ava_1628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1628
Symbol
ID	3681872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	2042468
End bp	2045548
Gene Length	3081 bp
Protein Length	1026 aa
Translation table	11
GC content	43%
IMG OID	637716968
Product	multi-sensor Signal transduction histidine kinase
Protein accession	YP_322146
Protein GI	75907850
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.677715
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.19967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGCTCT CCAATCTTTT TAGGAAAAGG TCAGCTAACA ACGAAAAGCT GAAAATTTCC 
TTACAATTTA TCCTCACCGT TCCCTTTGTG CTGTTAATAG GGGGAACAAC AGGTTTAGTC 
AGTTATGTAT CATGGCAAAA TTCCCAAAAT TCAGTCAATA GCTTGGCATA TCAGTTGATG 
AATGAGATGA GCGATCGCAT TCATTTATAT TTAAGTAATT ATTTAAAGAC TCCACATTTA 
ATTAACCGTC TCAATGTTCA AGCCAGCACA CTCCAACATA TAGACGTTAC CAACCCTCAA 
AGTTTAGAAC GTTATTTTTT TGCTCAGGTT CAAGAATTTG CTTCTCTGAG AGTCCATTTT 
ATCAATCCTC AAGGGGGACT GATTGGAGCC GGCAACGATG AACGGGGTGT TACCATTTCC 
TCGACCAAAG ATTTTAAAAA AGGAGAGCTT TATGTGTATA GCGTAGATAG TCAAAGAAAA 
CGGAAGAAAT TATTAGTTCA TCAGCATAAT TATGATGGCA CTCAAAGACC TTTCTATCAA 
CAGGCGCTCT CCACAGGCAA ACCAACGTGG ACATCGGTTT ATTTATATGT ACCGACTTCC 
AGAGGCTTAG GAATTGCTGC TAGCTACCCG CTTTATAACC AAAGACAAGA ACTTCTGGGG 
GTTTTCACCA GCGATATAGA CCTTGTGAGC ATTAGTAAGT TCCTCCAGCA ATTGCGGGTG 
GGTACTCACG GACAGGTATT TATTATGGAG CGTTCAGGAT TAATGGTTGC GTCTTCAACC 
CCTGAACAAC CATTCCTGAC AGGTATGGGT GGGACACAAA ATCAACGGCT CCAGGTGATA 
CAAAGTCAGC AACCCCTAAT TCGTTTAGCG GGTGAACATC TGCGATCGCA CTTTGGTAAT 
TTAGCTCAAA TTCAGACCGC AAAGCAGCTC AATTTTGACA TCAAAGGCAA AAAGCAATTT 
CTTCTCGTTA TCCCTTACAA CGACCAATTA GGACTTGACT GGTTGATTGT GACAGTGATC 
CCCGCCTCAG ACTTTACCGC AGAAATTGAT GCCAATACAC GCCTAACAAT AATTTTTACT 
ATTGGGGCTT TAGCAGGAGC GATCGCTTTA GGATTATTTT TGACCCAATT TATTATCCGA 
TCAATGGAAC AATTGGGTCA AACTAGCTTG GCGCTCTACA ACGAGCTGCA CTTACGCAAA 
ATTGCCGAAT TAGAACTGCG ACGGCAAAAA GACTTGTGTG AAAGCATTTA TAATGAATCG 
GCTGATGCTC TGTTCTTAGT AGATCCGCAA ACACTGTTAA TTGCCGACTG TAATCGTCGA 
GCAGTAGAAC TATTTGAAGC TGACAGTAAA AGTGAACTAA TTAGTATTAA AGTTAACACT 
CTTCAACTGC AACCATTTAC CTCAGACGAA CTGGCACAAA TCACCACCCA AATCCAGCAA 
AAAGGTGTTT GGAACACGGA AATTCAATAC CTGACGCGCA AAGGAAATTT GTTTTGGGGC 
AACCTCGCAG CCAAGGAAGT GACGATGGTC TGCGACCGAC CGTCGGTTAT CACTAACCAA 
GTGGTTTATC TAGTACGAGT AACAGATATT ACTGAGCGCA AGCGAGCCGA AACCGCCCTG 
CTACAAAGTG AAGCTCGCTT TCAAAAAATT GCCGCCGCTT CTCCGGCACA GATTTATATT 
TTGGCTTATT ACCCAGATAT AAATCAAATG CGTTATGAAT ATATCAGTTC CGGGGTGCAA 
GAAATTCAAG AATTAGAACC CCATCAGGTT TTGGCAGATC CTCTACTGAC TTATCAACAA 
GTTCATCCTG ATGATCTCGC TCTCTACAAT CAGCTAACAA CTCGTAGCCT CAAAACCCTC 
AAACCCTTTG CTCATGAATG GCGAATTATT ACACCCTCTG GCAAAGTCAA GTGGGTACGC 
GCCAACTCCC GGCCAGAACG TCGCTCCAAT GGTGAAATTG CTTGGTACGG AGTTGTATTA 
GATATCACTG ACCTTAAACA AGCCGAGGCC GCTTTGCGTG AGAGTGAAGA GAGATTTCGC 
CACGCGTTTT ATGATGCTCC CATTGGTATG GCGTTGCTGG GATTGGAGGA TCAACAATGG 
TTGCAAGCCA ATCCCATGCT CAGGGAAATG TTGGGCTATT CTGAGTTAGA ATTTTTCAGC 
TTCCAGGCAT TTGAGATCAT TCACCCAGAA GATATTCATC GGCTAGAAAA CTGCATCACA 
CAAGTTTTGA GTAATCAGAA TCCCAGAGTT CAGGTAGAGT TGCGTTACCT GTGTAATGGA 
GGACGCATTG CTTGGGGACT AACAAGCTTG TCCCTGGTGC GAGATTGCCA GAATCAACCG 
TTGTACTATG TGCTGCAAAT CCAAGATATC ACCGAACAAC AAGCTATTGA ACAGATAAAA 
AATGAGTTCA TTTCTATCGT CAGTCATGAA CTGCGTACCC CACTCACAGC CATTCAAGGA 
TTTTTAGGAC TGTTGAACAC TGGTATATAC GACAACAAAT CACAAAAAGC CAAATGGATG 
ATCCAACAAG CTTTAACAAA TAGCGATCGC CTCGTGCGGT TGGTAAATGA TATTTTGGAT 
TTAGAACGTT TGTCTTCTGG GCGAGTACAA CTTGTCAAAG AAGTCTGCCA TGCCGCAGAT 
TTAATGCAAC GAGCTGTAGA AGGAGTACAG TCAATCGCCC TAGCATCTGC TATCACAATT 
TCCCTGACTC CCACCACCGC TTGCGTTTGG GCTTCTCCCG ACTTAATTAT TCAAACCCTC 
ATCAATTTAT TGAGCAACGC CATCAAGTTT TCTCCTCATA ACTCAGTGAT TACTTTGTCT 
GCTCAACCCC AATCAGACTG GGTACTGTTT AAAGTCCAAG ACCAAGGCAG AGGTATCCCT 
GCCAACAAAC TAGAAACAAT ATTTGAACGT TTTCAGCAAG TGGACATCTC TGACGCTCGT 
GCTAAGGGTG GTACAGGTTT AGGTTTGGCA ATTTGTCAAA GTATTATTCA ACAGCATGAT 
GGTAGTATTT GGGCAGAAAG TACCCTTGGT GAAGGCAGCA CCTTTTATTT CACTTTGCCA 
ATATCAGTAA AAGAACTATG A

Protein sequence

MRLSNLFRKR SANNEKLKIS LQFILTVPFV LLIGGTTGLV SYVSWQNSQN SVNSLAYQLM 
NEMSDRIHLY LSNYLKTPHL INRLNVQAST LQHIDVTNPQ SLERYFFAQV QEFASLRVHF 
INPQGGLIGA GNDERGVTIS STKDFKKGEL YVYSVDSQRK RKKLLVHQHN YDGTQRPFYQ 
QALSTGKPTW TSVYLYVPTS RGLGIAASYP LYNQRQELLG VFTSDIDLVS ISKFLQQLRV 
GTHGQVFIME RSGLMVASST PEQPFLTGMG GTQNQRLQVI QSQQPLIRLA GEHLRSHFGN 
LAQIQTAKQL NFDIKGKKQF LLVIPYNDQL GLDWLIVTVI PASDFTAEID ANTRLTIIFT 
IGALAGAIAL GLFLTQFIIR SMEQLGQTSL ALYNELHLRK IAELELRRQK DLCESIYNES 
ADALFLVDPQ TLLIADCNRR AVELFEADSK SELISIKVNT LQLQPFTSDE LAQITTQIQQ 
KGVWNTEIQY LTRKGNLFWG NLAAKEVTMV CDRPSVITNQ VVYLVRVTDI TERKRAETAL 
LQSEARFQKI AAASPAQIYI LAYYPDINQM RYEYISSGVQ EIQELEPHQV LADPLLTYQQ 
VHPDDLALYN QLTTRSLKTL KPFAHEWRII TPSGKVKWVR ANSRPERRSN GEIAWYGVVL 
DITDLKQAEA ALRESEERFR HAFYDAPIGM ALLGLEDQQW LQANPMLREM LGYSELEFFS 
FQAFEIIHPE DIHRLENCIT QVLSNQNPRV QVELRYLCNG GRIAWGLTSL SLVRDCQNQP 
LYYVLQIQDI TEQQAIEQIK NEFISIVSHE LRTPLTAIQG FLGLLNTGIY DNKSQKAKWM 
IQQALTNSDR LVRLVNDILD LERLSSGRVQ LVKEVCHAAD LMQRAVEGVQ SIALASAITI 
SLTPTTACVW ASPDLIIQTL INLLSNAIKF SPHNSVITLS AQPQSDWVLF KVQDQGRGIP 
ANKLETIFER FQQVDISDAR AKGGTGLGLA ICQSIIQQHD GSIWAESTLG EGSTFYFTLP 
ISVKEL