Gene Acid345_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2035
Symbol
ID	4073204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2437727
End bp	2438752
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	637984049
Product	serine phosphatase
Protein accession	YP_591110
Protein GI	94969062
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG1734] DnaK suppressor protein [COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG CAGAAACCGC CTACATCAAC CAGATCCGCG AACAACTGGT AACGCGTCGC 
CACAATCTCG AGACCGCGAT CACCAAGCAT GAATCGGCGC AGATTACGCA CCTCTTGCAC 
GATGTGGATC AGGCGTTGGC TAAGCTCGAG ACCGGGAACT TTGGGGTCTG CCAAAACTGT 
CATGAGTCCA TCGAAGTGGA CCGCGTGATG GCTGACCCGT TGGTGACGTT CTGCCTCGGC 
TGCCTCACAC CCGCGCAGCA GCGCAGCCTC GAACAGGACC TCGAACTCGC AGCCCGCATG 
CAGATCGGCC TGCTGCCGCC CGACGATTCC GCGGTAGCTG GTTGGGAGAC AGCCTTCCAT 
TTCCGTCCCG CGCGTGTGGT CAGCGGCGAC TACTTCGACA TCATCGGCGA CGATCACGGC 
GGAATGTACT TCATCATGGC CGACGTCGCC GGCAAAGGCG TTGGTGCCGC GATGCTTACC 
GCCAGCCTCC GCTCGGTATT CCGCGCGCTC ATCCCAACCG CCGATTGCGT GGGCGAACTC 
CTCACCCGCG CCAACCGCCT CTTCTGCGAG AGCGCCATGT CCGGCCAGTA CGCCACCCTG 
GTGTTCGGCC ATGTGAATTG TGACGGCGCA CTCGACGTCG CCAACGCCGG TCATTTGCCA 
TTACTACTAG CGAAGGGAGC GGATTTGGAG GTTATCGAGA GCACCGACTT GCCCTTTGGC 
ATGTTCTGCT CTCAGCAGTT CACCGTGCAA CGGACTTCCC TGCAACCAGG CGATACGCTG 
GTGCTCTACA CCGACGGAAT TTCCGAGGCG CTGAACGAAG CGGGCGAAGA ATTTGGAGTC 
GAACAGATGC GCGAGTTCGT CCAGTCGCAC GGAACGAAGT TGCCCTGCGA GATGGTGAAG 
AACTGCCGCG AGCGCCTCGA TGGCTTCCGC GGAAACGTCG AGCGCTTCGA CGACGAGACG 
ATGCTGGCGA TCCAATTCGC TCCCGCCAGC AAGCTGAGCG AACCGCGGCA TCACGCCGTG 
ATGTAA

Protein sequence

MTTAETAYIN QIREQLVTRR HNLETAITKH ESAQITHLLH DVDQALAKLE TGNFGVCQNC 
HESIEVDRVM ADPLVTFCLG CLTPAQQRSL EQDLELAARM QIGLLPPDDS AVAGWETAFH 
FRPARVVSGD YFDIIGDDHG GMYFIMADVA GKGVGAAMLT ASLRSVFRAL IPTADCVGEL 
LTRANRLFCE SAMSGQYATL VFGHVNCDGA LDVANAGHLP LLLAKGADLE VIESTDLPFG 
MFCSQQFTVQ RTSLQPGDTL VLYTDGISEA LNEAGEEFGV EQMREFVQSH GTKLPCEMVK 
NCRERLDGFR GNVERFDDET MLAIQFAPAS KLSEPRHHAV M