Gene Acid345_3068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3068
Symbol
ID	4071975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3645621
End bp	3647459
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	60%
IMG OID	637985087
Product	serine phosphatase
Protein accession	YP_592143
Protein GI	94970095
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.266208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCGCGC GCCCCCGGTC CCCGAAAGGT TTCTTCGTGA CGGCTACTGG CACCGTGCCC 
AGCGGACAGC AGGACGACCT CCTCCAGGCA TTCGCAACCG CGATTACTCA CATTACTGCG 
CCGCGTTCGC AGAACGACCT CATTTCGCAG ATCAGCACGC TGATGGTGGC GAACTTTGGG 
GCTGCACGCT CCGAGCTTTG GCTGCATGAC GGTAGCGACA ACCTGAACCT CGCGAGCGCG 
GCGGGAGCGG CGGCCGAGCA CAACATGCTG CGGATGTCGG TGGAAGGGAA CCCGATTGGC 
CAGGCGTTCA CGGAGCGCAA ACAGATTTCC GCCCAGGAGC CGACGAGCAC GCTGGCGTAT 
GTCTCGGTGC ATCCGCTGGT GAATTGCAAT CAGTGCCTTG GCGTAGTGGT GAACGCGGCG 
CAAAATCCGC CAAGCGATGA ACAGAGGGGC TGGTGGCAGA CCTTCGCCGA TGCGAGCGCA 
ATCGCGCTGC ACCAGATGTT CGCGTCCGAA GATAGCCAGA AGACGATTAC GCAGCTGTCG 
TTGCTGTTCG AAGCGACGCG ACTGCTGAAC TCGACGCTCG ATCTTGCAGA GCTGCTCGAG 
TTGATCATGA AGATCGCGCG CACCGAGGTG AAGGCCGACC GGGGAAGCGT GTTCCTTGTA 
GATAAGGCAC ACAAGGAGTT GTGGTCGATT GTGGCGTCGG GACTGGAGCA CCAGGAACTG 
CGCGTGCCAT TCGGGCGTGG CGTGGCAGGC CGTGTGGCGG AGACCGGCGA AGTGATCAAC 
GTGGCCGATG CGTACACGCT GCCGTTCTTC GATCGCAGCT TCGACCAGAA GACTGGGTAC 
ACGACGAAGT CGCTGCTGTG CCTGCCGATT CGTCACCACA ATAATGAGAT CGTCGGCGTG 
CTGCAGTTGC TGAACCAATC CACGCACGGA CGGTTCACCC CCGAAGACCA GGAGTTCCTT 
ACCAAGCTGA CCGGCCACAT GGCTATGGCC CTGGAGAATG CACGGCTGCA CCGCGAGGCA 
CTCGAGAAGC AGCGCATGGA ACGCGACCTG GCGGTGGCGA GAAACATTCA GCGCAGCCTG 
TTGCCGGAAG CGCCGCCGGT GGTGCCGGGA TACGACATCG CCGTGATCAA CCACATGTGT 
TACGAGGTCG GCGGCGATTA CTACGACTTT CTAAACCTGG GTCCGCAAAC GCTGTTGATC 
GTTGTTGCTG ACGTCGAAGG CAAGGGCGTT AGTTCGGCGT TGGTGATGTC GAACTTGCAA 
GCGACGCTGC GCGCGCTGGT GATGCACCTG CACTCGCTCG AGGTGCTGAC GATCTCGCTG 
AACGAAATGA TCTTCAACGA CACCAAGTCG GAGAAGTTCC TCAGCATCTT CCTGGGGCTG 
GTGGATATTC GTCGCGGTGG GTTGCATTAC ATCAACGCAG GGCACGTGCC GCCGATCCTT 
GTGAAGGGCG CGACGGGCGA GTTCAAGACG CTTGAAGATG GCGGGACGGT GATCGGATTG 
TTCCCGGATG CGGAGTACAA CCGAGGCTCG GCGAAGTTGG AGCCGGGGGA CATCCTGGTG 
TGCTGCACCG ACGGCATTGA GGAAGCGAGC AATACTGAAG ACGAAGAGTA TGGGACCGAG 
CGGCTCGCGG AGGCAGTGGC GCGGCATCGG TCGAAGCACG CGAAAGAGAT TGTAGAAGCG 
GTGCTGGAAG AAGTGACAGC ATTCTCCGTC GGCGGGAAGA ACATTGACGA CAAGGTGTTG 
ATGGTGATGA AGGTCACGAC CGATGGAAAG TTTGATCAGG CGAACGCGGC GGGAGAGAAA 
CAGCTGGTGA AGGAGCCAGT GCTGCCGAGG CATCGGTAG

Protein sequence

MAARPRSPKG FFVTATGTVP SGQQDDLLQA FATAITHITA PRSQNDLISQ ISTLMVANFG 
AARSELWLHD GSDNLNLASA AGAAAEHNML RMSVEGNPIG QAFTERKQIS AQEPTSTLAY 
VSVHPLVNCN QCLGVVVNAA QNPPSDEQRG WWQTFADASA IALHQMFASE DSQKTITQLS 
LLFEATRLLN STLDLAELLE LIMKIARTEV KADRGSVFLV DKAHKELWSI VASGLEHQEL 
RVPFGRGVAG RVAETGEVIN VADAYTLPFF DRSFDQKTGY TTKSLLCLPI RHHNNEIVGV 
LQLLNQSTHG RFTPEDQEFL TKLTGHMAMA LENARLHREA LEKQRMERDL AVARNIQRSL 
LPEAPPVVPG YDIAVINHMC YEVGGDYYDF LNLGPQTLLI VVADVEGKGV SSALVMSNLQ 
ATLRALVMHL HSLEVLTISL NEMIFNDTKS EKFLSIFLGL VDIRRGGLHY INAGHVPPIL 
VKGATGEFKT LEDGGTVIGL FPDAEYNRGS AKLEPGDILV CCTDGIEEAS NTEDEEYGTE 
RLAEAVARHR SKHAKEIVEA VLEEVTAFSV GGKNIDDKVL MVMKVTTDGK FDQANAAGEK 
QLVKEPVLPR HR