Gene Acid345_2179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2179
Symbol
ID	4071431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2600271
End bp	2601986
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	59%
IMG OID	637984195
Product	hypothetical protein
Protein accession	YP_591254
Protein GI	94969206
COG category
COG ID
TIGRFAM ID	[TIGR03436] VWFA-related Acidobacterial domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.306316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGGC CCCTTCCCAT CTTCCTTCTT GCAGCTATGC TCCCCTCTGT GCTCGCAAAG 
TCTTCCGGCC AGGCAGCCTC AGGCGCTGTC CCGCTCCCTA CGTTCCGCAC ACAGACCGAG 
CTCGTCACCG TTCCCGTTGT CGTCACCGAC AAGAGCGGCA AGCACATCAC CGGCCTCAAA 
CAATCTGATT TCACCCTTGA AGAGAACGGC TCCCGTCGCG AGATCTCTCA CTTTGAAGAG 
ATTTCACCGA CTTCCGAAGC CTACCGTGTT CCCGACAAGG TCGCGCGTGA ATACTCTAAC 
TTCATTCCCA CGGATGCCAA CGTCCGCCGC ACCTCGATCA TCGTTATCGA TCTGCTGAAT 
ACCCCGTTCC GTCACCAGGC GCAAACGCGC AAAGAGATCA TTTCCTACCT CTCAAAGCAT 
GTGGAAGATA ACGGCCCCAC TTCCCTTTGT ATTCTGGATG GCAACGGCTT AAAGCAGATC 
CACAGCTTCA CTAGCAATAC TTCCGTCCTG ATCGACGCTC TCAAGCTGGT GAACGGAAAG 
CTCTCTTCGC AGGACCTGCA GGCGGCCGGC AACCTGGTGA ACCCCGACAG CCCGCATCCC 
TTTGACGACG CCACGGCCGA CATCAATGTC GCCGACACCT CCACACAACT CCTCGAAGTG 
ATGGCCGAGC GCGTTGATGC CGACTACGCT GCTTACGATC AGCGCCTCAA CACCCAGAAG 
ACTCTCAAAG CACTCGAGCA GATCGGCCAG GCCTACGCCG GAATTCCCGG ACGGAAAGCG 
CTCCTTTGGG CGACCGGCGG CTTTCCGTTT TTCCTCAATG ATCCCCGCAG CGTCATCGGC 
ATTGATAGTT CGCTGATGCA GAACTACGAG CGCACCTGGC AGATCCTCAA CGCCGCCAAC 
ATCGCGCTTT ATCCAATCGA TTCCCAAGGC CTGCTTCCGC CCGACACGTC GCAGCGCGGC 
TTCGCGTCGT CCCGCACGTC TGTCGCGTCG CGCGGATCAT CGCTGGCTCC GAATCGTCCG 
ACGAGACTGC CCATTGATGC CCGCACCAAC ATCGAAGACT CGCTGCGTAC CTTCGCAGCC 
GCCACCGGCG GTCAGGCCTG CCTCAACACC AACGATCTAG CTAACTGCTT CGCGAAGGCC 
GCGACCGATT CTTCGCAGTA CTATCTGCTG AGCTATTACC TGTCCCAGAA CGACCGTAAG 
CCCGGCTGGC GAAAGTTGAA GGTCCACGTC GCCGTGTCGT CCGTCGAAAT CCGCGCCCGC 
GACGGTTTCT TTATCGGCGA TACCAAGCAG CACTCGGAAG GCAGCCTCAA AGAACAACTC 
GATACCGCCG CTGTCTCCCC GATTGACTAC ACTTCAATCC CGCTCGCCAT CCAACTCAAG 
GAAATCACCA AGGCCGCGAA CGGAGACCAC AACGTTTCCT TCACGTTGCT AGCGCAATCG 
GGCGCGCTCA CCATCGACAT CGCCGACAAC AACCACGTTT ACGTTGATAT CGGCGCCGTT 
GTCGAAAATG GCAAGGGGCA GCTTGCCCGC GTCCTCGGCC AAACCATTGA CGCCCACATC 
AAGCCCGACA ACATCGCGAA GGTCATGAAG GAAGGCGTCA GCTTCACCAG CGACCTCGTC 
GTCCCCGCCG GCAAAGCCAC GCTCCTCCGC TTCGTTGTCC GCGACGGCCA GTCCGGCAAA 
ATGGGCAGCG TCACCGTGCC AATCCATCTT GAATAA

Protein sequence

MIRPLPIFLL AAMLPSVLAK SSGQAASGAV PLPTFRTQTE LVTVPVVVTD KSGKHITGLK 
QSDFTLEENG SRREISHFEE ISPTSEAYRV PDKVAREYSN FIPTDANVRR TSIIVIDLLN 
TPFRHQAQTR KEIISYLSKH VEDNGPTSLC ILDGNGLKQI HSFTSNTSVL IDALKLVNGK 
LSSQDLQAAG NLVNPDSPHP FDDATADINV ADTSTQLLEV MAERVDADYA AYDQRLNTQK 
TLKALEQIGQ AYAGIPGRKA LLWATGGFPF FLNDPRSVIG IDSSLMQNYE RTWQILNAAN 
IALYPIDSQG LLPPDTSQRG FASSRTSVAS RGSSLAPNRP TRLPIDARTN IEDSLRTFAA 
ATGGQACLNT NDLANCFAKA ATDSSQYYLL SYYLSQNDRK PGWRKLKVHV AVSSVEIRAR 
DGFFIGDTKQ HSEGSLKEQL DTAAVSPIDY TSIPLAIQLK EITKAANGDH NVSFTLLAQS 
GALTIDIADN NHVYVDIGAV VENGKGQLAR VLGQTIDAHI KPDNIAKVMK EGVSFTSDLV 
VPAGKATLLR FVVRDGQSGK MGSVTVPIHL E