Gene Acid345_0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0979
Symbol
ID	4068646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1239056
End bp	1240261
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	61%
IMG OID	637982986
Product	chaperone DnaJ-like
Protein accession	YP_590056
Protein GI	94968008
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00109475
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAACAC AGACCAAAGA TTATTACGGC GCGTTAGGGG TTAAGAAGAA TGCTTCGGCG 
GAGGAGATCC GCAAGGCGTT CCGCAAACTT GCGCGCAAAT ATCACCCGGA CGTGAACCCC 
GGGGACAAGA AGGCCGAAGA CAAGTTCAAG GAAATCTCCG AGGCGAACGA AGTCCTGAGC 
GATCCAAAGA AGCGGAAGAT TTACGACCAG CTCGGGTTCT ATTCGGACAA CATTGATCCG 
GCTGCGGCCG AGGCGTATGC GCGTAACGGC GCGACGGGCG CGGGTGGATT TGGCGGTTAC 
GATCCGCGGG CCGCGCAGGG CGGGCAGGAC ATTCCGTTCG ACTTCAGTGG ATTTGATTTT 
TCGCAGGAAG CGGGCGAACC GTCCGGCGGC GGCGGCTTCC GCGATATCTT CTCTTCCCTA 
TTTGGCGGAG GGCGCGGTGG ACACGAGGAG CGTCCGCGGC CGCAGGCAGG AACCGACCTT 
GAGTACCAGG TGAATGTGCC CTTCTGGGAT GCGATCCGCG GGACGACGGT GAAGCTGAAC 
ATCCAGCGGC GCGAAGTTTG TTCGAACTGC CATGGCGAAG GCGAAATCGG CGGGACGCAT 
ACGTGTCCGC AATGCCATGG CAAGGGCAAG ATCGAGACGG GCGGCGGGCC GATGAAGTTC 
AACGTCACGT GTCCGACGTG CCACGGCACC GGCAAGGCGC GAACCCAGTG CCCGGTGTGC 
CATGGCGAAG GCGCGATCAC GCGCAACGAG CCGCTGGAAT TCAAGATCAA GGCCGGTACG 
CGCGATGGTC AGCGCATTCG TCTTGCGGGC AGAGGGAATG CCGGCACGAT GGGTGGCGCA 
AGCGGCGATC TGTACATCAT TGTGAAGGCC GGGGAGCATC CGGTATTCAG GCGCGAGGGC 
GATGACGTCT ACGTGACGGT GCCGGTGTCG GCGGTGGAAG CGGCGCTAGG AACGAAGATC 
GAAGTGCCGA CGATTGATGG ACGCGCACTG CTGAAGATTC CGCCGGGAAC GAACAGCGGA 
CAGAAGCTGC GGCTGCGCGA AAAAGGCGTT CCGAACGCTG CCGACGGAAC GAAGCGCGGC 
GATGAGATTG TCGAGGTGAA GCTCATCGTG CCGAAGGTGA GCGATGAGCG CTCGAAGGAG 
ATTCTGCGCG AGTTGCAGAA GCTGAATCCG GAGGATCCGC GGGAAGAGTT GTGGAGACAG 
GTGTAA

Protein sequence

MATQTKDYYG ALGVKKNASA EEIRKAFRKL ARKYHPDVNP GDKKAEDKFK EISEANEVLS 
DPKKRKIYDQ LGFYSDNIDP AAAEAYARNG ATGAGGFGGY DPRAAQGGQD IPFDFSGFDF 
SQEAGEPSGG GGFRDIFSSL FGGGRGGHEE RPRPQAGTDL EYQVNVPFWD AIRGTTVKLN 
IQRREVCSNC HGEGEIGGTH TCPQCHGKGK IETGGGPMKF NVTCPTCHGT GKARTQCPVC 
HGEGAITRNE PLEFKIKAGT RDGQRIRLAG RGNAGTMGGA SGDLYIIVKA GEHPVFRREG 
DDVYVTVPVS AVEAALGTKI EVPTIDGRAL LKIPPGTNSG QKLRLREKGV PNAADGTKRG 
DEIVEVKLIV PKVSDERSKE ILRELQKLNP EDPREELWRQ V