Gene Acid345_2218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2218
Symbol
ID	4072963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2636700
End bp	2637632
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	62%
IMG OID	637984234
Product	protoheme IX farnesyltransferase
Protein accession	YP_591293
Protein GI	94969245
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0109] Polyprenyltransferase (cytochrome oxidase assembly factor)
TIGRFAM ID	[TIGR01473] protoheme IX farnesyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.446862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.810917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCGG TCACACAGCC GCTTGCGGTT CCCCGCCCGG GTGTTGCGTC GCTTCTCCGC 
GACTACTCTG AATTGACCAA GGCCCGCGTC ACCACGCTCA TCGTGATGAC CGCCTGGACC 
GGCGCATTCT TCGGCGCGGC CAAATCAGGA TTGCCGCTGG TGAGTTGGAC GCTGTTCCAT 
GCGCTGCTCG GCATCGGTCT CGTCTCCGGC GGTACAGCCG CGATGAACGA AGTGATCGAG 
CGTGAGTCCG ACGCGCGCAT GCGCCGCACC GCCATCCGTC CGCTAGTGAC CGGCAGCATG 
AGCCTGGGCC ATGGCATGGT CGTCTCGCTG GTAATGATGA TCGGCGGCGC CGGCTATCTT 
GGCCTCATGA CCAATTGGCT CACCGCTGCA CTCGCGCTGA TGACCAGCGT GGTCTACCTG 
ATGGCGTATA CGCCGTTGAA GAAGATCCAC CCCATCTGCA CCACCATCGG CGCCTTCCCT 
GGCGCGATGC CGCCGGTGCT CGGCTGGACC GCCATCCGCG GGCATCTCGG GTGGGAAGCA 
GTTGCGTTGT TCGCCATTCT GTTCTTCTGG CAGTTCCCGC ACTTCCATTC CATCGCATGG 
CTCTACCGTG ACGACTACGC GAATGCGGGA ATCCGCATGC TGCCCGTGGT CGAACGCGAT 
GGCCGCTCTA CGGCGCGCGA GATCGTGATC TACGCAGCCT TCCTGTTGCC GATCACCCTG 
ACACCGTTCC TGCTGCGTTT TGCCGGAAGA ATCTACTTCC TGGCGGCGCT GGTGCTTGGC 
AGCATGCTTT TCTGGGTGAG TCTCCGCATG TTCACCATGA ACCTGGCGCC CAGCTCACCG 
CATTCCAAGA AATACGCGCG ACAGTTGCTG CTGGCGTCCG TGACGTACCT GCCACTGCTA 
TTCGCGGTGA TGATGCTGGA TCGGACGATC TAA

Protein sequence

MSSVTQPLAV PRPGVASLLR DYSELTKARV TTLIVMTAWT GAFFGAAKSG LPLVSWTLFH 
ALLGIGLVSG GTAAMNEVIE RESDARMRRT AIRPLVTGSM SLGHGMVVSL VMMIGGAGYL 
GLMTNWLTAA LALMTSVVYL MAYTPLKKIH PICTTIGAFP GAMPPVLGWT AIRGHLGWEA 
VALFAILFFW QFPHFHSIAW LYRDDYANAG IRMLPVVERD GRSTAREIVI YAAFLLPITL 
TPFLLRFAGR IYFLAALVLG SMLFWVSLRM FTMNLAPSSP HSKKYARQLL LASVTYLPLL 
FAVMMLDRTI