Gene Acid345_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1077
Symbol
ID	4070037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1351345
End bp	1352664
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	60%
IMG OID	637983086
Product	guanosine polyphosphate pyrophosphohydrolases/synthetases
Protein accession	YP_590154
Protein GI	94968106
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0317] Guanosine polyphosphate pyrophosphohydrolases/synthetases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.163028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0154714
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAAC TGATTCAATC GGCCAAACAG TTTGCGCTGC AGCAAACCGA GCGTATTAGC 
CAAAGCCGGC ACCCCAAGCA GCAGACCGCC GAGAACCATC TCAAAGCAGT TGCGCAAAAC 
GTCGCCTCGG TCACTTCCGA CCGCAACGCA ATCGCTGCCG CATGGCTTCA CGACATCGTG 
GGAGACACTC CTGTCACCCT CGGTATGATC GAGCGACGCT TCGGTGCCGA TATCGCGCGA 
CTCGTGCATG AACTCACGCC GGTAAGTCGG CCTGGTGATG GCGACCGCGC TGCGCGTTTT 
GCCAAAGACA AGCGCCACTT CGCCGCAATC TCACCAACCG CGAAACTGGT GAAACTGGCC 
GACATGATCG ACACCTGCCG CGACCTGCGC GCCGCTGATC CAGCAGTCGC TCGCCCCTTT 
CTTCTCGAGG TTACAGAGCT GCTTCCGGTG CTCGAAGACG GCGACATTCG TCTTGCTGCC 
CGTCTTCGGA AAGAACTGCA AAGAGCTCCC AAAACCTTGG GTGATGTCGA AGCAACACCT 
CCCCCGCGGC TGGAGCCTCT CGCCATTTCG CTCAACGCTC TACGGGTTTT CGAGCGCGCC 
TTCAGCGCCT GGGACATCGC CGATCCCCTG CTCCTGTTCC ATGCGGATGC CGACGCCGCG 
GAATGTCGTC ACGAGATCGA AGCAGCGCGA GAAGAAGTCG CCGCGGTGTG GCAAGACGGC 
GCTCTGCGCG GATACGTCAC CGGCTCTGAA TTGAAGGAAG GAACCTGCGC CGGTTACGTG 
CGGGCCATCG CGCCGGACCA GTTGCTCGAT GCCGACGGTT CACTCACCGA CGCCATTGAA 
ATCCTGACGC GTTACGATGC CTGCTTCGTA ACTTGGGACG GCGAGCCAAG GGGCGCCATT 
ACACGGGTTG ACGCCCATAA GCCTGCGGTG CGCATGTGGC TCTTCGGGAT CATCACCGTC 
ATCGAAATGG AGTTCACCGA ACGCGTTCGC CAGCAGTGGC CGGCAGGTGG TTGGTCCACG 
CTAGTCTCGG CAGGCCGTTT GGAGAAGGCG CGGCAACTCT TTGCCGAGTG TACGCGTCGC 
CACGAAAAAT GCGAGCTCCT CGATTGCCTG CAACTCGGCG ACAAAATTCA GATTCTCATC 
AGCGACCCCG CATCTCTCGC ACTCATCGAC ATTCCCACTG CAAACGCAGC CAAACGCATC 
ACTGCGCAGA TTGAATCATT ACGGAATAAA CTTGCGCATT CACAGGATTT TATCGATCAG 
GACTGGCCAC AGGTGGTGCG TCTCGCGCGC CGCGTTGAGC ACATGGTGCA GCAGTTCTAG

Protein sequence

MPELIQSAKQ FALQQTERIS QSRHPKQQTA ENHLKAVAQN VASVTSDRNA IAAAWLHDIV 
GDTPVTLGMI ERRFGADIAR LVHELTPVSR PGDGDRAARF AKDKRHFAAI SPTAKLVKLA 
DMIDTCRDLR AADPAVARPF LLEVTELLPV LEDGDIRLAA RLRKELQRAP KTLGDVEATP 
PPRLEPLAIS LNALRVFERA FSAWDIADPL LLFHADADAA ECRHEIEAAR EEVAAVWQDG 
ALRGYVTGSE LKEGTCAGYV RAIAPDQLLD ADGSLTDAIE ILTRYDACFV TWDGEPRGAI 
TRVDAHKPAV RMWLFGIITV IEMEFTERVR QQWPAGGWST LVSAGRLEKA RQLFAECTRR 
HEKCELLDCL QLGDKIQILI SDPASLALID IPTANAAKRI TAQIESLRNK LAHSQDFIDQ 
DWPQVVRLAR RVEHMVQQF