Gene Acid345_1348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1348
Symbol
ID	4070886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1636670
End bp	1638328
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	62%
IMG OID	637983357
Product	hypothetical protein
Protein accession	YP_590424
Protein GI	94968376
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA CATCCACCCT CAGGCTCCGG CGCAACGCCG CGCAAATGCA TGCTCTCGCG 
GAGGTCGAGC GGACCATCCG CGCCACCGAC CCGCACAGCC GGCGGAAATA CCTGCGGGAG 
TTCACCGAAG CCTTCCAATC CTACCACTCG GTTATCACCG CGGGACAAGT CCGCGAGCAG 
CTTGCCGCCA GCGATATCGT GCTCGTCGGC GACTACCACG CCCTCGCCAG TTCGCAGCTT 
TATTGCGAAA AAGTCATTAC CCAACTTGCC TCGGAAGGCC CGGTCCTACT CGGGTTGGAG 
ATGATCTTCG CCCGCGACCA GCACCTGCTC GATGAATGGA CCTCACGCGA AATTGATGGC 
GCTGAGCTGC GCGAACGCCT CCGCTTCGAC ACCGACTGGG GCTACGACTG GTTTCCCATG 
TATCGGCTGC TGGAAACTGC CCGCGCCAAC TGCGTTCGGA TCTATGGCCT CGATTGCTGT 
CCGCGTAACG ATCTCCGCAA GATCGCACGG CGAGACATCC ACGCCGCGCA CCGCCTGCGC 
CGGATTCGCA AGGAGCAGCC AAACGCGAAG ATCGTGGTGC TCTTCGGCGA GTCGCACCTG 
GCGCCCATGC ACCTGCCGAT GGAAATTCGC AGCGTGCTGC CGGACGAGAA GGTCACGACC 
GTCCTGCAAA ACGTGGACGC ACTCTATTGG AAAGCCGGCG GCGAACGTCG CGACCGCGTG 
GAAGCCGTTT GCGTGCGCGA GGATGTGATC TGCGTCTTCA ACGCCACGCC GCTGGAGAAG 
TACGAGAGCT ACCGCATGTA CCTGGAGCGC TGGGCGCGCG AGCCGCGGGC TTCGCTGGAC 
ATGGCACCGA CCGTGCTGAA CCTCGCCGAC GCGCTGCTCC AGTTCCTGAA CATTGATAAG 
TACACCGCGA CCGCCGGCAA CACGGGCATG AGCCTGGTGG ATGTCTTTCC CGAGGTCTGC 
TACCGGCCCA CCGACGAAGG CATCATTAAG CTCGCGCTCC GCAAACATGC CGAGGCCGAG 
TTGCCGATGA TCCTGCGCAA GCTGCACGAG CAGGGCTGCT GCTACGTGCC ACGCTTGAAC 
TCGTTTTTCA TGCGGCACTT CGAAATGCTG CACATGACCG AGGAGATCGC GCACTTCGTG 
CATCGCGCGT GCCGTGCGGC GATCGGCAAG GTGCCAGTGA GTATCATCGA GCGCAAAGCT 
GAAGACAATT TTTACGCGCA GGTACTCGAG TGCGCGCTGC GCATCTTCGG TTCGCGCGTG 
CTGTATCCGT CGCGACCGGT GCTGCATGAG GAGCATTTGT ATGCCTTGTA CGCCTCGACC 
GATCCGCGCT CTGACTTCCC TCAGGAAGAG CTGGAAGGCC TCTTGGACTT CCTGGTAATG 
CACAAGGATT TCGAAACGCA TCGCGGCAAG TACTTCCGCC GGCCGGTCCT CCTGGAGCAT 
GGGATCGCTG CCACCGGCAG GAGGTTCACG TATCTCACGC GACAACTGGG CGAGCTGCTG 
GGCCACCAGC TTTATGAAGC CTATCTCTCC GGACAAATCA GCAAGCGCGC GCTGCGAACG 
CTGTTCTTCT GCGATCTGAG CGCCCCGGGA GCAGCGGAGG CCACGTATTT CGGCATCGCC 
AAGCGTTGCG CCACACGCCC GATGAAACTG GTTTCCTGA

Protein sequence

MATTSTLRLR RNAAQMHALA EVERTIRATD PHSRRKYLRE FTEAFQSYHS VITAGQVREQ 
LAASDIVLVG DYHALASSQL YCEKVITQLA SEGPVLLGLE MIFARDQHLL DEWTSREIDG 
AELRERLRFD TDWGYDWFPM YRLLETARAN CVRIYGLDCC PRNDLRKIAR RDIHAAHRLR 
RIRKEQPNAK IVVLFGESHL APMHLPMEIR SVLPDEKVTT VLQNVDALYW KAGGERRDRV 
EAVCVREDVI CVFNATPLEK YESYRMYLER WAREPRASLD MAPTVLNLAD ALLQFLNIDK 
YTATAGNTGM SLVDVFPEVC YRPTDEGIIK LALRKHAEAE LPMILRKLHE QGCCYVPRLN 
SFFMRHFEML HMTEEIAHFV HRACRAAIGK VPVSIIERKA EDNFYAQVLE CALRIFGSRV 
LYPSRPVLHE EHLYALYAST DPRSDFPQEE LEGLLDFLVM HKDFETHRGK YFRRPVLLEH 
GIAATGRRFT YLTRQLGELL GHQLYEAYLS GQISKRALRT LFFCDLSAPG AAEATYFGIA 
KRCATRPMKL VS