Gene Acid345_2299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2299
Symbol
ID	4071453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2724578
End bp	2725579
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	57%
IMG OID	637984315
Product	TPR repeat-containing protein
Protein accession	YP_591374
Protein GI	94969326
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.868951
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGC CGCGTTGGTT TGGCTTCGCT TTGCTTTGTT GCGGCCGAAT AGCTGCTATG 
GGCCAGCAGA ATGGAGAAGA GGTATCTAAC CTCGGGAACT TAAGTGTCAA CCTTCAGATT 
CGAGTGTTGA TGGCGGATGA CCGCGCGGTC TCGCAGAGCC TTCATGTTCG ACTTATGTCC 
GAAGGGGCGA CTGTGTCTAC CACCCAGACC GACTCATCGG GCTCCGCTGC GATGACTATT 
ACCCGGGCGG GAACATATCA GATCGAGGTT TCTGGCCCGG GGATCGAGAC CACAGATTCC 
GAACAGTTTC CGATCGTCCG AGCAGACAGG AACCACAACG AAGTCATTCG GGTTGCACTC 
AAAGGGCAAA AGGTCGAAGG GAAACCCACC GCTGGCGGGG TGGCACCCGC AAGCGGGTTC 
ACTGTCCCTA AAGATGCGAG CAAGGAATTC GATGCCGGCG TCTCAAGCAT GCACGCCAGC 
GACTGGAAGA AAGCCCAAGA GCATTTTCAG AGCGCGATTG ATAAGTATCC GAATTTCGAC 
GCAGCCTGGG ACAACTTAGG CATGGCGCGT CAAAATGGCG GTGACGCCGC CGGCGCCAAG 
GCTGCATACC AGAAGGCCCT GGGACTGAAC GACCACAACG CCGACGCGCA ACGCAATCTT 
GCGCGAGTTT TTGAGGCCGA GGGGAATTGG CCTGGCGCGG AAGAACTGCT CGTCAAATCG 
CTCGGGATTG AGCCGAATAA TGCCGGATCG CTGACTCTAC TTTCCATCGC GCAGTTAAAG 
CAAAACAAGA TAGACGAAGC GATTGCCAGC GCCGGCCGTG TCCACGCCCT CGAACACAAG 
TCTTACGCGA CGGCGCATCT CGTCCTTGCC CAGGCCTACG AGATGAAAGG CCGCACGAAA 
GATGCAATCT CGGAGTACCA ATTGTTTTTG AGTGAAGAGC CGAATGGTCC GCGGTCGGAG 
GCGGCGAAGA AGAAGATGGC CAAGCTTCAG GCGGCTGGCT AG

Protein sequence

MKLPRWFGFA LLCCGRIAAM GQQNGEEVSN LGNLSVNLQI RVLMADDRAV SQSLHVRLMS 
EGATVSTTQT DSSGSAAMTI TRAGTYQIEV SGPGIETTDS EQFPIVRADR NHNEVIRVAL 
KGQKVEGKPT AGGVAPASGF TVPKDASKEF DAGVSSMHAS DWKKAQEHFQ SAIDKYPNFD 
AAWDNLGMAR QNGGDAAGAK AAYQKALGLN DHNADAQRNL ARVFEAEGNW PGAEELLVKS 
LGIEPNNAGS LTLLSIAQLK QNKIDEAIAS AGRVHALEHK SYATAHLVLA QAYEMKGRTK 
DAISEYQLFL SEEPNGPRSE AAKKKMAKLQ AAG