Gene Acid345_2241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2241
Symbol
ID	4072986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2659967
End bp	2661214
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	61%
IMG OID	637984257
Product	AAA ATPase
Protein accession	YP_591316
Protein GI	94969268
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1222] ATP-dependent 26S proteasome regulatory subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.245938
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.85938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGACC TATTGAAGAA AATTCTGGAT GGCCAGAACC AGTTTGCGTC TGGCGGCTTG 
TTGCTGATGA TCCTCGGCAG CGTGGGCGTG TTTTTGCGTT CGTTGCCGTC GCAACTGTGG 
AGCTGGATCA TGCGGCAGTC CACCATGTCC ATCACCGTAA AGGACGACGA CCAGGCCTTC 
GCGTGGGTGA AGGAGTGGTT TCTCGAGCAA AAGTTCCTGA AGCGCGTGCG TCGTCTCGAT 
CTCGATACGT CGCTGCGTGG CGCGGAAGCT GCCATGGTTC CGGCGCCGGG CCGTCACTGG 
TTCATGCGCG GCGGGCGCCC GTACTGGGTG TGGTTCTGGC GAACCGAGAA CACCAAGGGC 
TACAACCAGC GCCGCATGGA GTCGTTCATG ATCGAGACCA TCGGACGCGA CCAGCAGGTG 
CTGCGGCAGT TTGTCGCCGA AGTGGTTGCG TGCCACAAGA AGAAGCTGCG CACCGCGTCG 
TACCTGTACC TGTACGACGA CGGCTGGGAC CGCGTTGAGT CCTACTGGCC GCGACGGCTC 
GACTCGGTGC TGTTGAAGCC GGGCGAGAAG GAACACCTCA TTCAAGACCT GGAGCGCTTC 
CGCGCGTCGC GGGACCGCTA CCGCCGGTTG GGTGTTCCCT ACCATCGCGG CTACCTGTTC 
TACGGACCTC CGGGAACCGG CAAGACGTCG TTGGTATCGG CGTTGGCCGC GCGGTTCGGG 
ATGTCGGTGT ACATCGTGAA CCTCTCGGAA CTGAACGACC GTACGCTGAA GACCGCGATG 
AACTGGGTTT CGGATAACTC GGTCATCCTC TTCGAGGACA TCGACTGCAT GAACGCCAGC 
ACCCGGCGTT CACAAGCAGG CGGCGCACCG CGAAGTGAGA CCGCAGACGA TCCGAAGGAG 
AAGAGCGCGA TCGACAAGAT GGGCGTGAGC TTATCGGGTT TGTTGAACGT GCTCGATGGC 
TTCTCGGCGC CGGAAAACGT GGTGTACGCG ATGACCACCA ACGACATCAG CGGACTCGAC 
GCGGCGTTGC TGCGTCCGGG CCGCATTGAT TACAAGCTCT ACCTCGGCGA GGCCTGCGAG 
TCGCAGAAGG TGGAGTTGTA CCGCCGCTTC TTCCCTGAGT CGTCGGAAGA GGAAGCTCGC 
GCCTTCGCAC AAGCGAACTG GGCCGAGACC ATGGCGGAGT TCCAGGGACT GCTTCTGGCA 
TTGGAGCAGG AAGTGGGAAC GACGGAAGTC GGAGTGGTTC AGTCGTGA

Protein sequence

MFDLLKKILD GQNQFASGGL LLMILGSVGV FLRSLPSQLW SWIMRQSTMS ITVKDDDQAF 
AWVKEWFLEQ KFLKRVRRLD LDTSLRGAEA AMVPAPGRHW FMRGGRPYWV WFWRTENTKG 
YNQRRMESFM IETIGRDQQV LRQFVAEVVA CHKKKLRTAS YLYLYDDGWD RVESYWPRRL 
DSVLLKPGEK EHLIQDLERF RASRDRYRRL GVPYHRGYLF YGPPGTGKTS LVSALAARFG 
MSVYIVNLSE LNDRTLKTAM NWVSDNSVIL FEDIDCMNAS TRRSQAGGAP RSETADDPKE 
KSAIDKMGVS LSGLLNVLDG FSAPENVVYA MTTNDISGLD AALLRPGRID YKLYLGEACE 
SQKVELYRRF FPESSEEEAR AFAQANWAET MAEFQGLLLA LEQEVGTTEV GVVQS