Gene Acid345_1659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1659
Symbol
ID	4069807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2004416
End bp	2005570
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	57%
IMG OID	637983667
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_590734
Protein GI	94968686
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0793424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAAATCG AGCGTTCCAT CCCGCGTCGG GAGAAGGCAG TCTGGCAAGA AAATCCAGAA 
TGGCTCTTTG AAAGTGCACC CGAAGCGATT TTCGTGTTCG ACGACGACTT GCAGTATCTC 
GAAGCAAATC CTGCCGCCTG CCGGCTCTTG CGACGGAATA AAGAAGAAAT CGTCGGCTGC 
AAGATTGGAA CTTTCTCAGA AGACGGTGCC CGGCTGGCGG AGGCAATACG AAAGACCCCT 
GTAGGCGACG GCGTGGAGGC GTCGCACACG CTGATTCTCC CGGATGGCAG TGTGCGAACG 
GTTGAGATGG TGACCCGACC GAACATGCTG CCGGGGATCC ACCTTTCGTT CAGCCGCGAT 
GTAACAGACC GGAGGCTGCT GGAGCGGGAA TTGGAACATC ACACGCGACT CGAAGCAGCG 
GGCAAACTTG CGAGTGGAAT CGCACACGAC TTCAACAATA TGTTGACTGC GATCCTGAGC 
TACGCCGACT TGCAACTTCA GCATGTTGAA TCCGGCTCGG CTATGCAGCG CTATGTCTTG 
GGAATACAGG CGGCGGCGGA GCGCGCGGCG CAGACGACGC ATCAGTTGTT GGCATTTTGC 
CGGCGTCAGA AGATGCAGTT TGCGGAGACG CAGGTCAACG ATGTGATTCA ACAGTCGTCG 
GAATTGATTG GGCGGCTCAT TGGTGAAGAC ATTGAGTTGG CGTTCGATCT CGATCGTGGC 
ATTCCCGAGG TATGGGCAGA CGCGGGACAG TTGAACCAGG TATTCGTGAA TCTGGCGGTG 
AATGCGCGCG ATGCGATGCC GAGGGGCGGA CGACTGCTCT TCGCGACATC CAAGCGCGGG 
ACGGAAGAAA AGGATAAACG CGTTTCCATT TTTGTCCACG ACACCGGAAT GGGAATTGGC 
GCTGATGTGC TGCCGCACAT CTTCGAGCCG TTTTTCACGA CGAAGGAGCA AGGCAAAGGA 
ACCGGTTTGG GACTCGCGAC CGTTTACGGA ATTGTGAAGC AAATGAAGGG CGAGATTCTG 
GTTAGCAGTG AACCGGGGCG TGGTACGACG TTTGAGATAG CACTTCCAGC CTCGCGGGCG 
GCGGGTGCTT GGGTAGAACC GGTGACCGCG AAGGCGAAGC CGAACAATAT GGAACATCGG 
CCATTTGCAG AGTGA

Protein sequence

MEIERSIPRR EKAVWQENPE WLFESAPEAI FVFDDDLQYL EANPAACRLL RRNKEEIVGC 
KIGTFSEDGA RLAEAIRKTP VGDGVEASHT LILPDGSVRT VEMVTRPNML PGIHLSFSRD 
VTDRRLLERE LEHHTRLEAA GKLASGIAHD FNNMLTAILS YADLQLQHVE SGSAMQRYVL 
GIQAAAERAA QTTHQLLAFC RRQKMQFAET QVNDVIQQSS ELIGRLIGED IELAFDLDRG 
IPEVWADAGQ LNQVFVNLAV NARDAMPRGG RLLFATSKRG TEEKDKRVSI FVHDTGMGIG 
ADVLPHIFEP FFTTKEQGKG TGLGLATVYG IVKQMKGEIL VSSEPGRGTT FEIALPASRA 
AGAWVEPVTA KAKPNNMEHR PFAE