Gene Acid345_4457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4457
Symbol
ID	4070940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5287844
End bp	5289640
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	59%
IMG OID	637986496
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_593531
Protein GI	94971483
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.235161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACGC GCTCCAAAAT CTGGATCGGG ATCGCTGCGC TTCTGGTCGC CGCGCAGGCA 
GTGGTCAGCC TCGGGCTTCC CCATACGGGG ATGCTCCACC TGCCCTTTGG TCTCGAGATA 
TCCGCACGTA TGTTCCGCAC CGCTTTCGGG GACCTGGCGC AGGCCATCAT CGTCGGTTTC 
GCGGGTTGCG TGATGTTGTT GAACGGCTTT CGCTCCGAAG GGCCGGCCCG AGTGTTCTGG 
ACCCTCTTCT CGCTCGGCAT GTTCTTCTGG CTCGCTGACC TCACCATCTG GTCGTACTAC 
GAGGTCGTGA TCCAAACCGA CGTGCCGCAA CTCACCCTCG GCGATAGTTA TCTCTTTCTT 
CACCTGGTGC CGATGGTCGC AGCGTTGGGC GCCCATCCCG ATCGCCGCGC CTCCGCCATC 
GGACGTCAAC GCACCTGGCT CGACTTCGCG GTACTGCTCA CTTACTGGCT CTACATCTAT 
GCGCTCATCG TGATGCCGCA CCAGTACGTA AAGCCCGATA TCCCGACCTA TAACTACAAC 
TTCGACATCA TCGACAAGTG CGGCCACTGG ATATTGGTCG TCGGACTTGC GGCGGCTTTC 
GTGCGATCCC GAGGCTCGTG GCGGCGCATC TTCCTGATGT TTACGCTCGC GTCGCTGTCG 
TACGCCGTGT TCTCCGATTT CGCAAACCTG GCCGTAGATA CCGGCAGCTA TTACACCGGC 
TCGGTGTATG ACATCCTGCT CATGGCGACC ATGGCGTTGT TTGCTCTGAC CGCGATCGAA 
GGCAGCAAGA TGCCGGCTAC GCCGGATGCC GAGTTGGCGC CGGCAGCCGA GCCGCCATTG 
GCGGGGTGGT CGATACAGTG GCCGGCAGTC AGCAGTACGC TGGTTACTCT TTCCATGCCG 
GCCATCGGAA TTTATTTGCT GAATTATGCG CCGACGATGG ATCCGGAGAT CCGCGCGTTT 
CGCTTAATCG TCACGTTCAT CGCGATGGTG TTGTTGTTCT CGCTGGTTTC GTTGAAGCAG 
ACACTGCTGC AGGCTGACCT TGTAGGCTCG CTCAAGAATG TCTCCGATGC CTACAGCGAT 
TTGAAGAGCG TGAAGAACCA GTTGGTACAG AGCGAGAAGC TCGCATCGAT GGGGCGGTTG 
CTTGCCGGCG CGGCGCACGA GATCAACAAT CCGCTGACGG CGATCCTGGG GTACTCGGAC 
TTGCTCACGT CAAGCATTTC ACTCGATCCG CAGACCCGCA GTATGGCCGA GAAAATCGGA 
CAGCAGGCGA GGCGCACCAA GACGTTGGTG GAAGACCTGC TGAAGTTCTC GCAGGAAACG 
CCGACCCAGC GTTCCTCGAA TGACGTACAG GTGCTGGTGC TCAATGCGAT TAAACTCGCG 
GGACTCGAGG CGGGGAAGAG CGTGAAAGTG GAAGTCACCG CCCCAGATAA ACTCCCGCCG 
GTCGCGGTGG ATCCCGGACA GATCCTTCAG GTGTTCGTGC ACCTGATCCG CAACGCCGCT 
GACGCGATGA GCGAATCGGT GGTGCGCGTG CTTCATATCT CAACGCGCGC AGGAAGTTCG 
CAGGTGCAAG TGGAGTTCGC GGACTCCGGT CCCGGCGTGA AGGATCCGGA CCTTGTCTTC 
GATCCGTTTT ACACGACGAA GTCGCCGGGC AAGGGAACGG GACTTGGGCT CAGTGCGTGT 
TACGGCATCG TGCAAAAACA CGGTGGGCAG ATCACGTGCG CCAATCGCCC GCAAGGCGGT 
GCGATCTTTA CCGTGACGCT ACCCACTGTC GAACAGGTTG AAATGCAGAA CGCCTGA

Protein sequence

MTTRSKIWIG IAALLVAAQA VVSLGLPHTG MLHLPFGLEI SARMFRTAFG DLAQAIIVGF 
AGCVMLLNGF RSEGPARVFW TLFSLGMFFW LADLTIWSYY EVVIQTDVPQ LTLGDSYLFL 
HLVPMVAALG AHPDRRASAI GRQRTWLDFA VLLTYWLYIY ALIVMPHQYV KPDIPTYNYN 
FDIIDKCGHW ILVVGLAAAF VRSRGSWRRI FLMFTLASLS YAVFSDFANL AVDTGSYYTG 
SVYDILLMAT MALFALTAIE GSKMPATPDA ELAPAAEPPL AGWSIQWPAV SSTLVTLSMP 
AIGIYLLNYA PTMDPEIRAF RLIVTFIAMV LLFSLVSLKQ TLLQADLVGS LKNVSDAYSD 
LKSVKNQLVQ SEKLASMGRL LAGAAHEINN PLTAILGYSD LLTSSISLDP QTRSMAEKIG 
QQARRTKTLV EDLLKFSQET PTQRSSNDVQ VLVLNAIKLA GLEAGKSVKV EVTAPDKLPP 
VAVDPGQILQ VFVHLIRNAA DAMSESVVRV LHISTRAGSS QVQVEFADSG PGVKDPDLVF 
DPFYTTKSPG KGTGLGLSAC YGIVQKHGGQ ITCANRPQGG AIFTVTLPTV EQVEMQNA