Gene Acid345_2178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2178
Symbol
ID	4073120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2598534
End bp	2600255
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	60%
IMG OID	637984194
Product	hypothetical protein
Protein accession	YP_591253
Protein GI	94969205
COG category
COG ID
TIGRFAM ID	[TIGR03436] VWFA-related Acidobacterial domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.119573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATGTA ACGTTCACAT CGGGAGTAAG TTCGTGACGC ACCGCACCCT GTTCGGGCTC 
GCGCTCATCC TTCTCGGAAC CACCATCGCT GCGCAGCAGC CCGCAGCTCC AGACAAGCCG 
ACTACATTCT CCTCGCGTAC CGAGCTGGTC ACGGTTCCCG TCATCGTGAA CGACAAATCC 
GGCAAGCACA TGACCGGGCT CAAGCAAACA GATTTCACCC TTGAAGAAAA CGGTCATCGC 
CGCGAAATTG CTAACTTCGA GGAGATCACC ACCACCGCTG CCCCACTGAA GCCTCGACCC 
GCGGCACAGT ACGAGTTCTC GAATTTCATT CCGAGCGATG GCCAAACTCG TCGCGTCACG 
ATCATCGTAG TGGATCTGCT GAATACGCCC TTTCTCTACC AGGCGCGCGC CCGCGCCGAG 
ATCGTCAAGT TTCTCAGCAA CCATCTTCAG GACAACGGTC CCACGGCCCT CAATGTCCTG 
AACCGCAACG GTCTTCGGCC GGTGCACAGC TTTACCACCG ACACCAGCGT CCTCATCGCC 
GCCCTCAACA AGCTGAAGTC CAATATCTCT ACCCAAGACG AACTCGCCAC AGGCGCCTTC 
GTCAATCCGG AATCCAGTAA TGCCCTCGAC GATCCCTCTT CCACCGAGGC CAGCCAACTG 
CTCGAGATCA TGAATCAGCG CGCCGATGCC GACTTCGGCG CCTACAAGCA GCGCATCCAG 
ACGCTCACTA CCCTCGATGC ACTCGATCAG ATCGCGCAGT CCTATGCCGG CATTCCGGGC 
CGAAAGACTC TTATCTGGGC GACGGGTGGT CTTCCCTTCC TTCTGAATGA TCCGGACAGC 
GTCACCGGCA TCGACACTAC CTTGATGGAC AATTACCAGC GCACATGGCG GGCTCTCAAC 
GCCGCGGAGA TCGCTGTGTA TCCCGTGGAC GCCCAAGGGC TCCTCGGACC CGACCTGTCG 
CAACGCGCCA TGAGTGCGCG CTCGCGTCCG CCCGCCATGA CCCAGGCTTC CCGTACCGGG 
GTTCGAGCCC CAACTCCTCT GCCCGTCGAT CCGCGCCAGA ATGCACAAGA TTCCTTACGC 
GCCTTTGCCC ACTCCACTGG CGGCCATCCC TGTATCAACC AGAACGACCT CGCCACCTGC 
TTTGCCCGCG CGGAAGAAGA TTCCTCGCAG TACTACCTGT TGAGCTATTA CCTTCCTTCC 
GACGATCGCA AGCCCGGCTG GCGCAAGTTG AAGGTGCAGG TCGCCGGCGC TCACGGCGAG 
ATTCGTGCCC GCGACGGTTT CTACGTTGGC GACAATCCGG CGCCCGACTC GAAGCGCGCC 
CGCAACGAGT TGCAACTCGC CTATTCTTCC CCGCTTGCGT TCACCGCAGT GCCAATGGAA 
GTTCACATAG CGAAGGCTGC ACCCGCGGAA AACAACACCC GCAAGGTGAG CTTCGATCTT 
CACTTTCCTG CGAACAGCAT CTCCATTGCG GCTCCCGATA ATGCAATCGG CCTCGACATT 
GAAGCCATCG CCACCGACGA GAAGGGCAAG TCGGTCCGTG TGTTTGCCAA GACCATCAGC 
GCGCATCTCA AGCCCGAATC TCTGCCGGGA GTCAACAAGA ACGGCTTTCG CCTTGCGGAA 
GAGTTGGTTA TCGCGAAGGG CCACTACCAG CTTCTCTTCG TCGTCCGTGA CGACGGTAAC 
GGCAAAATTG GCACCCTCGG CGCACCCCTC CAGGTTGACT AG

Protein sequence

MECNVHIGSK FVTHRTLFGL ALILLGTTIA AQQPAAPDKP TTFSSRTELV TVPVIVNDKS 
GKHMTGLKQT DFTLEENGHR REIANFEEIT TTAAPLKPRP AAQYEFSNFI PSDGQTRRVT 
IIVVDLLNTP FLYQARARAE IVKFLSNHLQ DNGPTALNVL NRNGLRPVHS FTTDTSVLIA 
ALNKLKSNIS TQDELATGAF VNPESSNALD DPSSTEASQL LEIMNQRADA DFGAYKQRIQ 
TLTTLDALDQ IAQSYAGIPG RKTLIWATGG LPFLLNDPDS VTGIDTTLMD NYQRTWRALN 
AAEIAVYPVD AQGLLGPDLS QRAMSARSRP PAMTQASRTG VRAPTPLPVD PRQNAQDSLR 
AFAHSTGGHP CINQNDLATC FARAEEDSSQ YYLLSYYLPS DDRKPGWRKL KVQVAGAHGE 
IRARDGFYVG DNPAPDSKRA RNELQLAYSS PLAFTAVPME VHIAKAAPAE NNTRKVSFDL 
HFPANSISIA APDNAIGLDI EAIATDEKGK SVRVFAKTIS AHLKPESLPG VNKNGFRLAE 
ELVIAKGHYQ LLFVVRDDGN GKIGTLGAPL QVD