Gene Acid345_0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0452
Symbol
ID	4071699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	540175
End bp	541611
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	57%
IMG OID	637982456
Product	cytochrome c family protein
Protein accession	YP_589531
Protein GI	94967483
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.395423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.353435
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGAAC CGAATCAGCG ACCAACGTGG TTTTTGATTT CGCAGCACTG GCTGAGCGTG 
ACCGGGGTCG TGCTCGTTAT CACCGCAGTG CTCACGTGGA TATTCATCCT GCCAGTTCAA 
TTGCGCGGGC ATGTGGATAA TCCGTATGCG GGACTGGTTG CGTTCGTTCT TCTTCCCGTG 
GTGTTTTTCG GGGGGCTCGT CCTCACCCCA ATCGGGCTCT TTCTGGCAAA ACGCCGGATC 
CGTCACGGTT TTTCGTCAGG TGGGTTCGAT CGGAAGAACG CACTGCGCCG CATCGCCATC 
GTCGTGGGCG TGACGACAGT CCTGAACATC CTAATAGGCA CACAGGTTTC CTATCGCGCC 
GTGAGCCACA TGGAGACACC TCAATTCTGC GGGGGGACGT GCCACGTAAT GGCGCCGGAG 
TACGCGGCAT ACCAGAACTC GCCCCACTCC AGGGTGGAAT GTGTCGGGTG TCACGTTGCT 
CCCGGCGCTT CGGGCTGGGT CAGCAGTAAA GCGGCGGGCA CGCGCCAGCT CGTAGAGACA 
ATTCTAAAAT CCAGCCCCAA GCCGATTCCT TCCGCAATCG AAACCAACCG CCTCGTGCCT 
GCGCGGGAGA CATGCGAACA CTGCCATTGG CCGGAGAAAT TCTCAGGCGT GAATCTACGA 
GTTCTGACGA AATATGCGCC GGACGAAACC AATACAAGGA CGCAGACCGT CCTCCTAATG 
ATGGTGGGGG GGGACAAATA TAAGGGCATT CACGGCGCAC ATGTCGGCCC CGGAATTCAC 
ATCCGGTTTG CTGCATCCGA TCCTAAGAGA CAGACGATTA CACGGGTACA GTATGAGAAT 
GAGTCTTCCG GCCTAAAAGA AGAGTTCGTC GCATCCGACA GCCAGAAGGC GGCGCCGGAT 
GGCACGGCGA CGATCGAGAT GCAGTGCGTG GATTGCCACA ACCGTCCGAC TCACACGTTC 
GAAATGCCCG AGCCTGGACT GGACAAAGCA CTCGCGCTCG GAGAGATTGC CGTGACCCTG 
CCTTATGTCA AGAAGGAGAG CGCGCAATTG CTGCAGGCGA CTTACACGAG CCAGGCAGAG 
GCGTCGGAGA AGATTCCTTC CCAATTAAAC GCCTACTATC AGCAAAACTA TCCCAGCGTT 
TACAGCCAGC GTGGGGCAGA AGTCGATCGT GCCGGGAAAG CGGTCCTCGC GATTTACAAC 
CGCAACGTTT TTCCGGAGCT TGGAGTTACA TGGGGAACCT ATCCGAACAA TCTCGGCCAC 
ACTGAGTCCC CCGGCTGCTT CCGCTGTCAC GATGGCTCGC ACACTTCAAG TTCAGGCAAA 
ACCATTCCGC AGGATTGCAA CAGCTGTCAC GAACCCCTGG CGATGGACGA GGCATCTCCG 
GAAATTCTTC AGAAGCTTGG CATCGCCGAG CGCATTTCCG CTCTTCAGCG AAAATGA

Protein sequence

MPEPNQRPTW FLISQHWLSV TGVVLVITAV LTWIFILPVQ LRGHVDNPYA GLVAFVLLPV 
VFFGGLVLTP IGLFLAKRRI RHGFSSGGFD RKNALRRIAI VVGVTTVLNI LIGTQVSYRA 
VSHMETPQFC GGTCHVMAPE YAAYQNSPHS RVECVGCHVA PGASGWVSSK AAGTRQLVET 
ILKSSPKPIP SAIETNRLVP ARETCEHCHW PEKFSGVNLR VLTKYAPDET NTRTQTVLLM 
MVGGDKYKGI HGAHVGPGIH IRFAASDPKR QTITRVQYEN ESSGLKEEFV ASDSQKAAPD 
GTATIEMQCV DCHNRPTHTF EMPEPGLDKA LALGEIAVTL PYVKKESAQL LQATYTSQAE 
ASEKIPSQLN AYYQQNYPSV YSQRGAEVDR AGKAVLAIYN RNVFPELGVT WGTYPNNLGH 
TESPGCFRCH DGSHTSSSGK TIPQDCNSCH EPLAMDEASP EILQKLGIAE RISALQRK