Gene Acid345_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3100
Symbol
ID	4072664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3684086
End bp	3685516
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	59%
IMG OID	637985119
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_592175
Protein GI	94970127
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.718748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCAA AGATTCTTAG CCGTCCGAAG GACACCGCGG CGTGGCGGCT TTCGATCTGG 
ACGACGATTG CCTTCGCAGC GGGCAGCGCG ATCGCGTTTG GGATCGTGTA TTACATGGTG 
TCGCTGGGCA TTCGCGAACG CAGCGACCAG TGGCTGGTTG GCGAATCGGA GACACTGAAG 
GAAGTTTCAG ATGCGACGCC GCGAGACAAT CTTTACCAGC GCGTAATTGA AGAAACCGCG 
CAAAACGCAG CCCACGAGAT TCCGGGTGAG CACGAAACCG AGGACGAGAA CCGGAACTCG 
GTGTTCTTTT TGCAAATCGA CAACCTTGGG GAGCCGCTGT GGTATGGCCC GGAGAACAGC 
CGCGACCGAT TCGTTGAAGC GGTCCGAGGT CTTCAACCGG GTTCGCCGCA GACACTGAAA 
ATTCCTGAAA ATGTGGTTCC CTATCGCGTG GTGGTACAAG ACCTCAAATC CGGCGGCACA 
ATCTACCTGG GACTTTCCGA TATTGGCGCC GTAGAACTGC TGCACCGGCT GATGCGCGGA 
TTCTTCATTG TGTGGATCGG CATGGTGCTG CTGGGATTGA TGATCTCGTA TCTCAGCGCC 
CGCCGAACGC TTTTACGCGT GGAGACGATC ACGCAGACGG TGTCGCGCAT TGGCAGCGAG 
GACCTGAGCG CCCGGCTGGC GGAGGCGCAC AATGCCGATG AAATCGCGCG GCTGGCGCAG 
ACTTTTAACC GCATGCTCGA TCGCATCCAG GCATCTGTGA ACCAACTGCG AACGGTCACC 
GGTGCGGTCG CGCACGACAT GAAGAGTCCG GTAACGTCCA TCCGCGGCAA ATTGGAAGTT 
GCCTTGCTCG AAGGCAGCGC GGCGGATTGG CGTGAGCCAG TGGCGGAAGC GGTAGAGGGC 
CTTGACCGGC TGTCGCAGTT CATCAATACA ACGCTCGATC TTGCCGAGGC GGAAGCGGGA 
GCCTTGCCGC TGCGAAAAGA GCCGGTGGAC TTCGGCGCGC TAGTGGAACA ATTCGTTGAC 
ATCTACACGC CAGCGTTCCA CGAAAATCAT CACCAGGTTC ACGTGCAGAT ACACGAGCCG 
GTAACGGTGG ACGTGGACGT GAGTCTAACC AACCGCATGC TTTCGAACCT GCTCGACAAC 
GAGATGGCAC ACCTGCCGCC GGGCTGCAAG ATTGACATTG AAGTGATGGC GCGCGAGCAG 
CAGGCAGAGC TCGTGATTCG CGATGACGGT CCGGGCTTCC CTGCTGAGTT GAAGGCGCAC 
GCGTTCGAAC GGTTCGTGAA GGGCAAAGAG TCCAAGGGAC ACGGACTGGG CCTGGCGTTC 
GTAGATGCCG TGGTGCAGGC ACATGGCGGA AATGTTGAGA TTGAAGACAC CCCGGGTGGG 
GGTGCAACGA TTCGAATCTT AATGCCGCTG GTGGCCGTGA GCGTGGGATG A

Protein sequence

MFSKILSRPK DTAAWRLSIW TTIAFAAGSA IAFGIVYYMV SLGIRERSDQ WLVGESETLK 
EVSDATPRDN LYQRVIEETA QNAAHEIPGE HETEDENRNS VFFLQIDNLG EPLWYGPENS 
RDRFVEAVRG LQPGSPQTLK IPENVVPYRV VVQDLKSGGT IYLGLSDIGA VELLHRLMRG 
FFIVWIGMVL LGLMISYLSA RRTLLRVETI TQTVSRIGSE DLSARLAEAH NADEIARLAQ 
TFNRMLDRIQ ASVNQLRTVT GAVAHDMKSP VTSIRGKLEV ALLEGSAADW REPVAEAVEG 
LDRLSQFINT TLDLAEAEAG ALPLRKEPVD FGALVEQFVD IYTPAFHENH HQVHVQIHEP 
VTVDVDVSLT NRMLSNLLDN EMAHLPPGCK IDIEVMAREQ QAELVIRDDG PGFPAELKAH 
AFERFVKGKE SKGHGLGLAF VDAVVQAHGG NVEIEDTPGG GATIRILMPL VAVSVG