Gene Acid345_4235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4235
Symbol
ID	4073161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5020865
End bp	5022010
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	57%
IMG OID	637986266
Product	serine/threonine protein kinase
Protein accession	YP_593309
Protein GI	94971261
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTGGG TTGCGGGAAC ACAAATTGGG GCCTATGAGA TCGTCGGGCC AATCGGCAAC 
GGCGGCATGG GCGAAGTTTA CAAAGTCCGC CATACAATCT CGCAGCGCAC GGAAGCCATG 
AAGGTGCTGC TCTCTGGAGC TGCACGCCGC CCGGAAGTCA CCGACCGTTT CGTTCGCGAG 
ATCCGCGTCC TAGCCAATCT CAACCATCCC AACATCGCCG CACTACACAC TGCGTTCCAC 
CATGAAGACC AACTCATCAT GGTGATGGAG TTCATCGAAG GCAAGAACCT GAGCGAAATG 
CTTTCGACCG GCATGGTGCT CCGCGATTCC GTTGCGTATA TCCGGCAGGC GGTTACCGCA 
CTCGCGTATG CCCACTCACA AGGCGTAATC CACCGCGATA TCAAGCCGTC GAACATCATG 
ATCAACAGCG CGGGACAGGT GAAGTTGCTC GACTTCGGAC TCGCACTGAT GAGCACTCCC 
GATCCGCGGC TGACTTCGTC GGGCTCACTG CTGGGATCGG TGCATTACAT TTCGCCGGAG 
CAGATTCGCG GCGAGACCAT GGATGCGCGC TCGGATTTGT ACGCCGTTGG CGTCACCTTG 
TTTGAAGTCA TCACCGGTCG GCTGCCGATC CAGGGTCACT CGTTCTCCGA GATCATCAAC 
GGGCATCTCC AGGTAATTCC GCCATCGCCC GCGGTTCTGA ACGCATGTAT CCCGGCGAAC 
CTCGCAGCGA TCACACTCAA GGCACTCGCA AAGAACCCAT CTGAACGTTT CCAGAACGCG 
TCGGAATTCT TGCAAGCGCT GGATACTGTG CAAATCGAGT CAGGCTTGCA CTTCGCCGTA 
ACGATGGAAA CGCCGTTTGT CTCGAGCGCG GTGGCTGCGG CGGCAGCTTC GAATACACCG 
AATCCTTCGG TCTCGCAGCC TTCCCAAGTG AAAGGCTACG ATCCGGCGGT GATCAACGAG 
ATCACTTCGC AACTCGCCAA CTATGTTGGA CCGATTGCAA AGGTGATTGT GAAGCGAGCG 
TCGAGCAGCT CGAACAATCT GCGCGAACTT TGCGACAAGG TTGCGCGCGA GATTGATTCC 
GAGAACCAGC GCAAGAATTT CTTGCAGAGC GTGCGAAAAC ACCTCGGCAG CTCGGACGCG 
ATCTAG

Protein sequence

MGWVAGTQIG AYEIVGPIGN GGMGEVYKVR HTISQRTEAM KVLLSGAARR PEVTDRFVRE 
IRVLANLNHP NIAALHTAFH HEDQLIMVME FIEGKNLSEM LSTGMVLRDS VAYIRQAVTA 
LAYAHSQGVI HRDIKPSNIM INSAGQVKLL DFGLALMSTP DPRLTSSGSL LGSVHYISPE 
QIRGETMDAR SDLYAVGVTL FEVITGRLPI QGHSFSEIIN GHLQVIPPSP AVLNACIPAN 
LAAITLKALA KNPSERFQNA SEFLQALDTV QIESGLHFAV TMETPFVSSA VAAAAASNTP 
NPSVSQPSQV KGYDPAVINE ITSQLANYVG PIAKVIVKRA SSSSNNLREL CDKVAREIDS 
ENQRKNFLQS VRKHLGSSDA I