Gene Acid345_4461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4461
Symbol
ID	4070944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5293240
End bp	5294598
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	61%
IMG OID	637986500
Product	histidine kinase
Protein accession	YP_593535
Protein GI	94971487
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATGT TCGTCACCCT GTCGGTGATC ACGACCATGC TCTTTGTGCG CCTCCAGACA 
TCGGATTCCG CAATGGAAAC GATGACGCGA ACCGCCGTAC AGGCGTATCA GGCTGGCGGT 
CCGGCATCGC TTCACAACTA CTTCCACACG ATCGAGCGCG ACCAGCTTTT CCGCGCGATT 
TTGTTTGACG ATCAGGGTCA CGAGCTGACC GGCCGTCCAG CCCCGCGGTT CCTTGGGCCG 
AATGGTGAAT ATGCGCCTCC ACCGCCACAG GGCCCAATAC CAGGGCCGCC TTCATTTGAC 
GAACTGATTA AGCGTAACTT CCCGCGCCAC ACCATCCAGG CTGTAGATGG CCACAAATAC 
ACTCTGATCC TGCTGCCGCC ATCGCGAGCG CACCTCTGGT TCCTCACCGC GCCAACGCGA 
CTGATCGGTA TTGTGATCGG CCTATGCGCC ACTGGCATCA TCTGCTTCTC CCTGGCCCGC 
TATGTAACCA AGCCATTGCA GCGACTTCGT GAAGCAAGTT CGAAGCTGGC TTCGGGCGAT 
CTGTCGGCAC GCGCGGGCAA TGGCATTCAC CGGCGTGATG AAATCGGCAG CCTCGTTCAT 
GATTTCGACC GCATGGCCGA CCGCATCGAA AACCTCATCA CCACCCAGCG CCGGCTCCTG 
AGCGACATTT CGCACGAACT GCGTTCGCCA CTGGCGCGAT TGAACGTTGC CGTGGGACTC 
GCCCGTCGCC AAGCTGACGT CGAGACGCAG AAGGCCCTCG AGCGCATCGA AATCGAAGCC 
GACCGCCTCA ACGACATGCT CCAGAATCTG CTGACGCTTT CCCGGTTGGA GAGTGGCGAA 
CCCGTTGAAA TGCGCACTAC GGTGGACATG AGCACTCTGG TGACAGACGT CGTTGCTGAC 
GCCGATTTCG AGGCACAAGC ATTTGGACGC GAAGTGCATC TCAGCACCTG CGAACCCTGC 
GAGGTTGAGG GGAACATCAC CCTCCTGCGC AGCGCGGTAG AGAACGTGGT CCGCAACGCC 
GCGCGTTACA CCGACGAGAA CACAAAGGTT ACGGTCGCAC TGACCACTAG CGGCAATCAT 
GCCGTCGTCG AAGTGCACGA CCAGGGGCCT GGCGTACCGG ACGAGTCGCT GCCAAAGTTG 
TTCCTTCCCT TCTATCGCGT GGATGCAACC CGTGATCGCA ACACCGGCGG CGTCGGACTC 
GGGCTCTCGA TTGCCGAGCG CGCCGTGCGG CTCCACGGCG GTTCAGTTGT GGCGAGGAAT 
GGAAGGCCAC ACGGTCTGAT CGTGCGCATC GAACTGCCGC TGCTGGCCCA CGAGTCCGCC 
CCAGTGAAGT CGGAACCAGC TGTGGTAAAG ACGACGTAA

Protein sequence

MAMFVTLSVI TTMLFVRLQT SDSAMETMTR TAVQAYQAGG PASLHNYFHT IERDQLFRAI 
LFDDQGHELT GRPAPRFLGP NGEYAPPPPQ GPIPGPPSFD ELIKRNFPRH TIQAVDGHKY 
TLILLPPSRA HLWFLTAPTR LIGIVIGLCA TGIICFSLAR YVTKPLQRLR EASSKLASGD 
LSARAGNGIH RRDEIGSLVH DFDRMADRIE NLITTQRRLL SDISHELRSP LARLNVAVGL 
ARRQADVETQ KALERIEIEA DRLNDMLQNL LTLSRLESGE PVEMRTTVDM STLVTDVVAD 
ADFEAQAFGR EVHLSTCEPC EVEGNITLLR SAVENVVRNA ARYTDENTKV TVALTTSGNH 
AVVEVHDQGP GVPDESLPKL FLPFYRVDAT RDRNTGGVGL GLSIAERAVR LHGGSVVARN 
GRPHGLIVRI ELPLLAHESA PVKSEPAVVK TT