Gene Acid345_3538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3538
Symbol
ID	4069270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4184735
End bp	4185814
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	60%
IMG OID	637985561
Product	PhoH-like protein
Protein accession	YP_592613
Protein GI	94970565
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA ACATCGAGAT CAGCCCGAAC ATCGAAACGC TCTTTGGAAC GCGTGACGAG 
AACCTCCGGA CACTCGAGAC CGGCATGAAA GTCCGTATCG ATCTCCGGTC CGATTCGATT 
CAGATTGAGG GCGAACAGGA GAATGTGACC CGCGCCGAAA AAGTGTTCAG CGACTTCGAA 
CACCTGCAGC GCAGCGGACA CGTCTTCCAG AACGGCGACC TTGGCGACAT GCTCCGCGTG 
CTCACGCACG ACCAGACAGC TACGCTTCGT GGCCTGGCTG AAGCAGGACG CCAGCGTTCG 
TTCGGCAAGC GCACGGTGCA GCCGAAGAGC ATCAACCAGC GGCGCTATCT CGAGGCCATT 
GAGAAGAACG ACATGGTGTT CGGCATCGGT CCAGCCGGAA CCGGCAAGAC CTACCTCGCG 
GTCGCGATGG CGATCTCGGC GCTGATGGCG AAGCGGGTGA ACCGCATTGT CCTGGCGCGT 
CCCGCGGTGG AAGCCGGCGA ACGCCTGGGC TTCCTGCCCG GAACGTTGCA GGAGAAAGTG 
GATCCGTACC TTCGTCCGCT GTACGACGCG CTTTATGACA TGGTCGATCC GGAGAAGATC 
GACCGCTATC TCGAGAAGAA CGTGATCGAG ATTGCACCCA TCGCCTTTAT GCGCGGCCGT 
ACGCTGAACG ACGCGTTCGT GATCCTCGAC GAAGCGCAGA ACACGACCAG CGAGCAGATG 
AAAATGTTCC TGACGCGTCT GGGCTTCAAC TCCAAGGCGG TGATCACCGG CGACGTGACC 
CAGATCGACT TGCCCAACGC CGCGCGCAGT GGCTTGGTGG AGGCGAGCGA GATCCTGAAG 
AAGGTGGAAG GAATCAACTT CACTTACTTC GACGACGGCG ACGTCGTGCG CCATCACCTG 
GTGCAGCGCA TCATCCGCGC CTACGACGAC AAGAAGAAGG CGAGCGCGGA GCAGCTTGAT 
CTGGCGCTGG AGACGAAGCC GATTTCCAAC GGAAACCCGC GGAAAGAGGC CGATCAGTCG 
CAAATTGCGC CGGTGATGCC GCCGCTTACG CCGCAGGGAA CCGACACCAT CAGCGAGTAA

Protein sequence

MKKNIEISPN IETLFGTRDE NLRTLETGMK VRIDLRSDSI QIEGEQENVT RAEKVFSDFE 
HLQRSGHVFQ NGDLGDMLRV LTHDQTATLR GLAEAGRQRS FGKRTVQPKS INQRRYLEAI 
EKNDMVFGIG PAGTGKTYLA VAMAISALMA KRVNRIVLAR PAVEAGERLG FLPGTLQEKV 
DPYLRPLYDA LYDMVDPEKI DRYLEKNVIE IAPIAFMRGR TLNDAFVILD EAQNTTSEQM 
KMFLTRLGFN SKAVITGDVT QIDLPNAARS GLVEASEILK KVEGINFTYF DDGDVVRHHL 
VQRIIRAYDD KKKASAEQLD LALETKPISN GNPRKEADQS QIAPVMPPLT PQGTDTISE