Gene Acid345_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1058
Symbol
ID	4068707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1326998
End bp	1328014
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	62%
IMG OID	637983066
Product	KpsF/GutQ family protein
Protein accession	YP_590135
Protein GI	94968087
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.711974
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.335757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTTACCAT CCTCTGTGCA ACTCACCATC ATGTCCAAGA CTGGCGAGAA CGTCGTCCGC 
ATTGAGGCCG AAGCCCTGCG CGAGTTGGCC GACCGTATAG CCGGTCCCAT GGCCGCCGAC 
TTCCAGCGCG CCGTCGATCT TCTCGCTTGC TGCGGAGGTC GCGTCGTCGT GAGCGGCATG 
GGCAAAAGCG GCTTGATCGG ACGCAAGATG GCCGCGACGT TCAGCTCTAC CGGCGCTCCG 
GCGTTGTTCC TGCATCCCGC TGAGGCCATG CACGGTGATC TCGGCATGAT TGCCCGCGGC 
GACGTCGTCA TCGCGCTCTC CGCCAGCGGC GAAACCGAAG AAATTCTCAA CCTGCTGCCG 
ACCATCAAGC GCCTCGGCGC CCCGGTCATC ACCATGACCT GCGACAACCT CTACGCCAAT 
GGGGCCAAGC GTTCAACGCT CGCGCAGGCC GCCGACGTCG CGCTCGATTG CTCGATCGCG 
CAGGAAGCCT GCACCCTCGG CCTTGCGCCA ACAGCCTCAA CTACGACGAT GCTGGCGCTC 
GGCGACGCAC TCGCCATGGC CCTGGCCGAG AAGCGCGGCT TCAAAGAAGA GGACTTCGCC 
AACCTCCACC CCGGTGGCAA GCTAGGCAAG CGCCTCACCA AAGTCAGCGC GCTAATGCAT 
GCGGGAGACG CCATCCCGCG CGTTACGGCC GAAACAAAAA TGTCCGACGT GATCTACGAG 
ATGTCGCGCA AAAAACTCGG CGTTACGACC GTCGTCAAGG GCGAAAAACT TCTCGGCATC 
ATCAGCGACG GCGACCTGCG TCGCCTGCTC GAGCATCGCG GAAAAGATGT AATGGATCTC 
ACCGCTGGCG AGTGCATGAC GTCGAGTCCG AAGACGATTC ATCCCGAAGC CTACGCCACC 
GCCGCCCTCG ACTTGATGGA GCAGCGCAAA ATTACTTCGC TCGCGGTCGT CGACAGCAAC 
GGCGAACTTA AAGGTATCGT CCACTTGCAT GATCTGTGGG GAACGGAGAT GTTGTGA

Protein sequence

MLPSSVQLTI MSKTGENVVR IEAEALRELA DRIAGPMAAD FQRAVDLLAC CGGRVVVSGM 
GKSGLIGRKM AATFSSTGAP ALFLHPAEAM HGDLGMIARG DVVIALSASG ETEEILNLLP 
TIKRLGAPVI TMTCDNLYAN GAKRSTLAQA ADVALDCSIA QEACTLGLAP TASTTTMLAL 
GDALAMALAE KRGFKEEDFA NLHPGGKLGK RLTKVSALMH AGDAIPRVTA ETKMSDVIYE 
MSRKKLGVTT VVKGEKLLGI ISDGDLRRLL EHRGKDVMDL TAGECMTSSP KTIHPEAYAT 
AALDLMEQRK ITSLAVVDSN GELKGIVHLH DLWGTEML