Gene Acid345_2398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2398
Symbol
ID	4071396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2838735
End bp	2840255
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	55%
IMG OID	637984414
Product	periplasmic sensor diguanylate phophodiesterase
Protein accession	YP_591473
Protein GI	94969425
COG category	[T] Signal transduction mechanisms
COG ID	[COG4943] Predicted signal transduction protein containing sensor and EAL domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.625554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAAAGT CTCCCATCAC CCCAGGATCG ACAGCTCTGC TCGTCGGACT TTTGGTCTTG 
CTGACGTCCT ATTTGGCCAT GGGCTCACTC GAGCGGTCGG TTGCGCGCCG GGAACTTGCG 
CTGCAGGCAG CCATGATGCT TCGAGGATTT CAGGACGGCT ACCAGAATGC GCGCGCCGAC 
CTGGCGAAGC TACCGTCCAT GGAAGAAATG AATTGCCGCG ATGGAATCAG TGACACGCTG 
GCGCGCCTCA ATTTCGATAA CCAATACGTC CGATGGTACG GAATCGCGCA AGAGGGCAAG 
GTGATCTGCC GTGGGCCACG GGTTGGCGTT GACTTGTCCG ATGCACGCTT CCATCGCATT 
GATGATGAGT GGTTCCTGAT CTCGACAGAG TCGCCCACGA AAGCAAGCAA CTTGTTGCTG 
GCGCAAAAAC GCGGCAACCT TTTGTATCTC GCCATGCTCG AACCCTTGCT GTTCGACTTT 
ATGCATGAGG TGGATTGCAA AGCATGTGTG TCGTTCGAAT TCCTGGTGAG CGCCCAGCCG 
AACGTTGAAA TGGAGTCTGC TCCCGCATCC GGCCCGTCTG TAATCCATTA CGTGGTGGAA 
AAAACGCGGC TCAACGCGCA AATGAAATTC ACGCTGAATG CTACGCAGGA GTATGTGGAT 
GCGTTCGCGT TCCCTGGGCG CGTACTGTCG ATGACGATCG CTGCCGCCTT CGGTCTTGTG 
ATCGGACTTT CGGTGTACGG GAATTTAACA AAATACACAT CGACGGCGTT TCTCATCGAA 
CAGGGCCTGA AGCGAAACGA GTTCCTTCCT TTCTATCAAC CCATTATTGA CAGTCGTGAC 
GGATCGATTC TTGGGGCGGA GGCACTCGTC CGCTGGCAGC CGAAAGGCGG AAACCTTATT 
CCGCCCGGGC AGTTCATTCC GTTTGCCGAA GAGAACCATT TAATTGATCC CATTACCGAC 
CAATTGGAAG AGAAGGTGCT GGACGATATC AAACAATTCG GCTGGCAAGA CTCCAGTCGA 
TTCGTCAGCA TTAATGCGGT CGCGGAGCAG ATAACGGACA CGCCCTTTTG TGCGAACCTG 
CTGCGACGAC TCGCAGAGAA GCGCATCCCG GCGAAGAATT TCTCAGTGGA GATTACGGAG 
CGGCATCAAT TCCCCGATCT CGACCGCGGG CGAGCCGCGC TGCAGTCCTT GGTAGAAGCC 
GGTATCGAGA TCAAGCTCGA CGACGCAGGC ACCGGATTCG GCGGCTTTTC CTACATCCAG 
GAATTGCCGA TCACCACATT GAAGATCGAC AAGATGTTCA TTGATACGCT TCGGCAAGAG 
AAGCAGGACC CCAAACGCGC GGTTCTGCAG GCGATTATTG AGTTCGCAAA GACTGCCAAT 
CTTCACGCAA TAGCCGAGGG TGTAGAGACC AAAGAACAAG TCAGCCAGCT GAGCGCGGCC 
GGGGTCTTCG CCATACAAGG CTACGTGTAT TCCAAGCCGA TGCCGGCAGA AGAGTTCATT 
CGCTGGATGA ACGCGCGCTA G

Protein sequence

MKKSPITPGS TALLVGLLVL LTSYLAMGSL ERSVARRELA LQAAMMLRGF QDGYQNARAD 
LAKLPSMEEM NCRDGISDTL ARLNFDNQYV RWYGIAQEGK VICRGPRVGV DLSDARFHRI 
DDEWFLISTE SPTKASNLLL AQKRGNLLYL AMLEPLLFDF MHEVDCKACV SFEFLVSAQP 
NVEMESAPAS GPSVIHYVVE KTRLNAQMKF TLNATQEYVD AFAFPGRVLS MTIAAAFGLV 
IGLSVYGNLT KYTSTAFLIE QGLKRNEFLP FYQPIIDSRD GSILGAEALV RWQPKGGNLI 
PPGQFIPFAE ENHLIDPITD QLEEKVLDDI KQFGWQDSSR FVSINAVAEQ ITDTPFCANL 
LRRLAEKRIP AKNFSVEITE RHQFPDLDRG RAALQSLVEA GIEIKLDDAG TGFGGFSYIQ 
ELPITTLKID KMFIDTLRQE KQDPKRAVLQ AIIEFAKTAN LHAIAEGVET KEQVSQLSAA 
GVFAIQGYVY SKPMPAEEFI RWMNAR