Gene Anae109_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1033
Symbol
ID	5376274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	1173857
End bp	1175530
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	74%
IMG OID	640842541
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_001378226
Protein GI	153003901
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAATC CTTCCGCCGG GGAGACGAGC TGCCGATCGT TCTCGAGGCT CTCCATCTTC 
TCCAAGATGG GGGCGCTCGC GGGGATCCTC GACTACGAGG AGGCGCTCGC CGCGGTCGCG 
CGGCTGTCGA TCCCGGAGCT GGCGGACTGG TGCATCGTCG ACGAGGTGGG CGACGGAGAG 
ATCCGCCGCA TGGAGGTGGC CCACCGCGAC CCCGCGAGGG CGTCCCTCGC CGCCGCCCTC 
CGCGCCTTCC CGCTGGACCA CTCCGCGCGC CGGCGACTCC CGGCCGCGCA GGCCCTTCGC 
TCCGGCCGAC CCCTGCTCCT CCGCGACTAC GGCGAGGAGC AGCTCCAGCA GCAGACGGAG 
GGCGAGTACC TCGGTCTCGC CGCCCAGATG AAGCCGTGCT CGGTGATGGT CGTCCCGGTG 
AGCCTCTCGG CGACGCGCGT GACGGTGACC TTCGTCATGA GCGCCGCCGA GTCCGGGCGG 
AGGTACGGAG AGGACGACCT GGCGCTGGCC GAGGAGCTGG TGCGGCGCGC GGCGCAGATC 
GTGGACAGCG CGCGCGTCCA CCACCAGCTC CGGCGGACCG AGGAGCGGTT CCGGGTCGCG 
CTGGCCCACT CGGGCATCAC GCTCTTCGAG CAGGACCTGT CGCTGCGGTA CAGGTGGATG 
TACAACCCGC CGCTCGGCTA TCGGGTGGAC GACGTGCTCG GGCGGACGAA CGCGGAGCTC 
CTCTCCCGCG AGGACGCCTC CCGCCTGCAG GCGCTCGACG ACGCCGTGCT GCGGTCCGGC 
CGCGCGGTCC AGCAGGAGGT GCGGATCACC GCTCCGGGAG GCGAGCAGCG CCACCTGCTC 
GTGACCGAGG AGCCGCTCCG CGACGCCTCC GGCGCGATCG TGGGCCTGAC CGGCGCCGCC 
ACCGACATCA CCGATCAGAA GCGGGCGCAG GAGGAGCTGG CGCGCGCGCT GGTCTTCCGC 
GAGCAGGTGA TGGGGATCCT GGGGCACGAT CTCCGCAACC CCCTCGGCGC GGTGCGCGCG 
CTGGCGTCGC TCCTGCTTCG GCGCGGCGAC GTCCCGGCCA GCGCCCACGC GAGCCTGGGC 
GAGATCGACC GCGCCGCGCG GCGCATGCTG GAGATGATCG GGACGCTGCT CGACTTCACG 
GACGGCCGCT TCAAGGGGGC GCTGCCCATC GCGCCCGTCC CTGCGGATCT CCACGAGGTC 
TGCCAGGACG TGATCGACGA GCTCCGCGCC GCCGATCCGC GCCGGACCAT CCAGGTCGCG 
CTGGAGGGCG ACGGCCGCGG CACCTGGGAT CCGGCGCGGC TCGCGCAGGT GGTGTCCAAC 
CTCGTGGCGA ACGCGCTCGA GCACGGCGTC CGCGGAGCGC CGGTACGGGT GACGGTGCGA 
GGCGACCACC AGCAGGTGGC CGTGACCGTC GAGAACCAGG GGGCCATCCC GCCCGAGCTG 
AGGCCCGTGC TGTTCGAGCC CTTCTGCAGC GGCTCCCGCC TGCGGGACGC CTCTCATGCG 
CGTGGCCTCG GCCTCGGGCT GTACATCGTC GATCTCGTGG TGCGCGCCCA CGGAGGCTCC 
GTCTCGTTCG AGTCCACCGC CGAGCGCGGG ACCGCCTTCA CCGTGCGGCT CCCCCGGGCG 
GCGGGGGTGA GCATCGCCGC GCCTCGGGAG GAAGCGGCGG CCTCGCCGGC GTGA

Protein sequence

MRNPSAGETS CRSFSRLSIF SKMGALAGIL DYEEALAAVA RLSIPELADW CIVDEVGDGE 
IRRMEVAHRD PARASLAAAL RAFPLDHSAR RRLPAAQALR SGRPLLLRDY GEEQLQQQTE 
GEYLGLAAQM KPCSVMVVPV SLSATRVTVT FVMSAAESGR RYGEDDLALA EELVRRAAQI 
VDSARVHHQL RRTEERFRVA LAHSGITLFE QDLSLRYRWM YNPPLGYRVD DVLGRTNAEL 
LSREDASRLQ ALDDAVLRSG RAVQQEVRIT APGGEQRHLL VTEEPLRDAS GAIVGLTGAA 
TDITDQKRAQ EELARALVFR EQVMGILGHD LRNPLGAVRA LASLLLRRGD VPASAHASLG 
EIDRAARRML EMIGTLLDFT DGRFKGALPI APVPADLHEV CQDVIDELRA ADPRRTIQVA 
LEGDGRGTWD PARLAQVVSN LVANALEHGV RGAPVRVTVR GDHQQVAVTV ENQGAIPPEL 
RPVLFEPFCS GSRLRDASHA RGLGLGLYIV DLVVRAHGGS VSFESTAERG TAFTVRLPRA 
AGVSIAAPRE EAAASPA