Gene Acid345_3986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3986
Symbol
ID	4072459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4716467
End bp	4717681
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	59%
IMG OID	637986013
Product	serine phosphatase
Protein accession	YP_593060
Protein GI	94971012
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.613472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCGTG AACCCATCGA GTGTGCGGTA AGATACCGGG ACACGTGGGG AGGATCGGCC 
ATCAAGCTTT TTGCGAAGTG GAATACCGGA TCGACGAAGC GGGCATCGTT CTGGCAGAGC 
CTGACGGGAC CGTCGCGCTT GATCTTCTTC GCGGCGGTGT TTTTTACGTT TTCCTGCCTG 
GGCTTCCTTA ATGTGATGAC CACTCCGCTG CGGCAGCCCG CATGGCAGAT TGTGGCGATG 
GTGCTCGGCA GCGCCATTTT TGCGATCTTC TACGCGTGGG CGGGCGTGCT GCGACGGTGG 
TGGTGGATGA TCGTTGTCGC CCTGTCACAA GTGGCGTACT TTACGGTGGT CGTTAGATTC 
GGAGGGCAGC GCGCCTTGCT GCTCGACCCG CATTCCGAGA CCCAGGTCCA GCTCTTTTGG 
ATGAGCCTGC TCGGCAAAAT AACGTTGATT GCCGGCTACA CCTTCTTCCT CATCTTCTTC 
GGGCGCGAAG GCGTTCGCTA CTTCCAGGCG CATGCGGAAA TCAAGCTGGC GCAGGAGATC 
CACCAGCGGC TGGTACCGAC CATCGAGCGG CAAATCGGAC GCTTCTCTCT GTACGGAAAC 
TCGGTGCCAA GCGGCGAGGT GGGCGGCGAC CTGGTGGACC TGGTAGAAGG CGGGAGTTGG 
ACGGCCTACG TTGCCGATGT CTCCGGGCAT GGCGTGTCAG CGGGCGTGCT GATGGCAATG 
TTTAAGACAG CGGTCAGAAC CACCGTGGTT GCCGATAGCC AGTCAAACCT GATGCTCGAT 
GCAGTGCACC GTGCTTTATA TCCGTTGAAG ACGCCGAACC TGTTCGTCAC CGCCGGCGTG 
TTGCACTGTG ATTCCGCGGG CGCTTTTAGT TTGTCGCTCG CAGGACATCC TCCGCTGCTG 
CATTACAGAA AATCAACGAG TGACGTTGTA GAGCATCCCG CCATGGATCT TCCGCTGGGA 
ATCCTGCCGG AGCAGAGTTT TCAGAGCACG CGCATCACGA TGGAGAGCGG CGACCTGCTG 
GTGTTGCTGA CCGACGGCTT CACGGAAGTC TTCGACGACA AGAAGAACGA GATGGGTATC 
GAACCGGTGA AGGCCACCGT GCAATCGAAC GCAGCACGCC CTTTACCGGA AGTATTCGCC 
GCGGTGCGCA AGATCGCGCT CGCCTTCGGC AAACAGGAAG ACGACCAGAC CCTGCTGCTT 
ATCCGAGCTA ACTGA

Protein sequence

MTREPIECAV RYRDTWGGSA IKLFAKWNTG STKRASFWQS LTGPSRLIFF AAVFFTFSCL 
GFLNVMTTPL RQPAWQIVAM VLGSAIFAIF YAWAGVLRRW WWMIVVALSQ VAYFTVVVRF 
GGQRALLLDP HSETQVQLFW MSLLGKITLI AGYTFFLIFF GREGVRYFQA HAEIKLAQEI 
HQRLVPTIER QIGRFSLYGN SVPSGEVGGD LVDLVEGGSW TAYVADVSGH GVSAGVLMAM 
FKTAVRTTVV ADSQSNLMLD AVHRALYPLK TPNLFVTAGV LHCDSAGAFS LSLAGHPPLL 
HYRKSTSDVV EHPAMDLPLG ILPEQSFQST RITMESGDLL VLLTDGFTEV FDDKKNEMGI 
EPVKATVQSN AARPLPEVFA AVRKIALAFG KQEDDQTLLL IRAN