Gene Acid345_4055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4055
Symbol
ID	4072477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4795109
End bp	4796869
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	60%
IMG OID	637986086
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_593129
Protein GI	94971081
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.424185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.174789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGGGG TTCGGCTGCG GACCAAGTTC CTGATCGCCA TGCTGCTCAC ATCCGCGGGC 
CTCACCATTG GCACTCTGCT GGTGGTGCAA CACACGGTTG CGGTGCGAGC ACGGGAAGGC 
ATCGTCGCCG ACCTCCAGAA CTCCGTAGAG AACTTTCGCG CGGAACAACT AGAGCGCGAG 
AAGAACCTGC GCGCTTCCGC GCGACTCCTC GCCGATCTCC CGATCGTGAA AGCCCTGATG 
ACGTCGCGCC ACGCGCCCAC CATTCAGGAT GCTTCCGAGG AACTTTTTAA GCTTTCCGAG 
CGAGACCTTT TCGCCCTGGT TGATCCAACT GGCCAGGTTG TCGGCTTCCA CACCAACCCT 
GCCGGAGTGC CGTCGGCGCC GATCCAGCAC GTGCTCTCGC AACGCGCACC CACTGCAAAT 
TCGTTCGAAT GGTGGTACAC CGGCGGACAC TTATACGAGG TGTATCTCGA GCCGATCTAT 
TTCGGTCCGA GCAGCAACGA CACGCTGCTG GGTGTCATCG CAGTTGGATA CGAAATCAAT 
GGTCCACTGG CGCGCCAGGT CGGAAGGCTG GCTGACAGTG AAGTCGCCGT GCTTTATCGC 
GGAAATGTCG TCGCAAGCAC GCTGAACGAC CGGCCGTCGC TCGAGTTCCT GCAGCATACG 
GGATCGAGCA ATTCCTCGCC TGCAGATGTC CTGCTGGGAC AGAAGAAGTT CGTCGCTACT 
TCTATCCTCC TCAGCGCTGA CGATTCCACG CCAGTGACGA TGGTCGTGAT GAAGTCCTAT 
GACAACGCCA TCTCCTTCCT GCAGCGTTTG CAGCGATTGC TTCTTGTAAT TGGGATTGCC 
GCGGTACTTG CGGGCAGCAT CCTTGTTTAC TTCATCGCGC GAACCTTCAC CCGTCCGCTC 
GAAACCCTTG CAGTAGGCGT GAGCGCTCTC GGCACCGGCG ACTTCGCGTT CCCTCTGCCG 
GGAGGTGGTG GCGGAGAAGT GGTGAAGTTG ACGCAGGCCT TCGTGGATAT GCGTGACCGC 
CTTCGCGCGA CGCAACAGAG CTTGATTGAG AGCGAGCGAC TGGCGACGAT CGGACGCATG 
GCTGGTTCGA TCTCGCACGA CCTGCGCCAT CCGCTGACTG CCGTGCTCGC GAATGCGGAA 
TTCCTCGCCG AAGCTAATCT CAACACGACA CAACGCGAAG AGCTGTACAT GGAAATCAGG 
GTGGCGGTGA ATCGCCTGAC GGATCTTGTT GACTCTCTGC TTGAACTGTC GCGTCCGGCG 
CAAGCGCTAA CGCTCACTGA GGGACCGATC GAAGGCAGCA TTTTGCGCTC GATCGAACTC 
ATTCGGGCTC ATCCCGAGTT CCATAAGGTG AGTATCGAAG TCGAGGGCGC AGCGGGAGTG 
GACACGCGGG TGGACGGGAG AAAGATGGAG CGCGTCTTCT ACAACCTCCT GTTGAACGCA 
TGCCAAGCGG TGCAGAGTCG CGCGGGCAAG GTCGTCATCA GCGTCACGGA GAGCTCCGCG 
GGAGTTGAAA TCCGGGTTCG TGACAATGGA CCGGGAGTGG AACCGTCGAT CGCGACAAAG 
TTGTTTCAGC CATTCGTGAG CGTCGGCAAA GAAAACGGTA CCGGACTCGG GCTGACGATC 
GCGCAGAAGA TCGTGCAGGA CCACGGCGGC TCGCTCGAAG TGGAGTGGTC GTCGCCGGGC 
AACACCGTGA TGCGGATCGT CCTGCCGCAA CCAACGCGAT CAGACCGATG GCGCGCGCCC 
CTCGCTAAGA GTTCTTTGTA A

Protein sequence

MGGVRLRTKF LIAMLLTSAG LTIGTLLVVQ HTVAVRAREG IVADLQNSVE NFRAEQLERE 
KNLRASARLL ADLPIVKALM TSRHAPTIQD ASEELFKLSE RDLFALVDPT GQVVGFHTNP 
AGVPSAPIQH VLSQRAPTAN SFEWWYTGGH LYEVYLEPIY FGPSSNDTLL GVIAVGYEIN 
GPLARQVGRL ADSEVAVLYR GNVVASTLND RPSLEFLQHT GSSNSSPADV LLGQKKFVAT 
SILLSADDST PVTMVVMKSY DNAISFLQRL QRLLLVIGIA AVLAGSILVY FIARTFTRPL 
ETLAVGVSAL GTGDFAFPLP GGGGGEVVKL TQAFVDMRDR LRATQQSLIE SERLATIGRM 
AGSISHDLRH PLTAVLANAE FLAEANLNTT QREELYMEIR VAVNRLTDLV DSLLELSRPA 
QALTLTEGPI EGSILRSIEL IRAHPEFHKV SIEVEGAAGV DTRVDGRKME RVFYNLLLNA 
CQAVQSRAGK VVISVTESSA GVEIRVRDNG PGVEPSIATK LFQPFVSVGK ENGTGLGLTI 
AQKIVQDHGG SLEVEWSSPG NTVMRIVLPQ PTRSDRWRAP LAKSSL