Gene Acid345_4540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4540
Symbol
ID	4070218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5383833
End bp	5384912
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	58%
IMG OID	637986579
Product	ribose-phosphate pyrophosphokinase
Protein accession	YP_593614
Protein GI	94971566
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0462] Phosphoribosylpyrophosphate synthetase
TIGRFAM ID	[TIGR01251] ribose-phosphate pyrophosphokinase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000021567
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.35999
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACAG CTGCAAAACC AAGCGCGGTG CAACCTCAGA ACAGCAGTTC GGCGGAAGTC 
GGAACCATCG TTACCGGCGG AGAACGAAAA GTGAACCCCG GACCCGATCC GAAAAACGAT 
CGTAAGCCGA CGCGGACGCC GGATCCGAAG TTCAAGATTT TTTCCGGGGC GGCGAATGAA 
CCGCTCGCGC AAGAAATTTG CGCGTTCCTT GGAATTCCGC TGGGACAGAC AAAGCTCACC 
AAGTTTTCGG ATGGCGAGAT TTATGTCCAG ATCCTCGAAA ACGTGCGCGG GGGGGACATC 
TTCCTGGTGC AGCCGACGTG TCACCCGGTG GACCATCACT TGATGCAGTT GCTGCTGATG 
ATTGACGCGT TGAAGCGCGC CTCGGCACGA CGCATTACGA CGGTGATTCC GTATTTTGGC 
TATGCGCGTC AGGACCGCAA GGACAAGCCG CGTGTTCCGG TGAGCGCGAA GCTCGTCGCC 
GATTTGCTGA CGACGGCCGG TGCGGATCGC GCACTCGTTG TTGACTTGCA CGCGCCGCAG 
ATCCAGGGCT TCTTCAATAT CCCGGTGGAC CATTTATTTG GATCACCGGT GTTGGTGGAC 
TACTTCAAGA AGCTGGAACT GCCCGATCTG ACCGTGGTTT CGCCGGACGC GGGCGGTGTG 
GAACGCGCCA GGTTCTTTGC GAAGAAGATG GATTCGGCGC TGGCGATTGT GGACAAACGC 
CGCACCGACA TGAACGTGAC CGAGGTGATG CACGTGATCG GCGATGTACA CGGCCGGACG 
TGCTTGATCC TCGACGACAT TATCGATACC GCGGGAACGC TGGTGAAGAC GGCCCAGGCC 
CTGGCGGATG CAGGCGCTTC GGAGGTTTAC GCATGCGCCT CGCACGCTGT GCTTTCGGGA 
GAAGCGATTA ATCGCATCTC GAAGTCGGTG CTCAAGGAGT TAGTTGTAAC CAACACGATT 
CCCCTGACGG ATGCCGGCAA AGCCGAGCCC AAGATCAAGG TGCTCTCGAT TGCCGGATTG 
ATCGCTCGCG CGATCCAGTC GATTCACGAA GAGACCTCCG TCAGCAAACT GTTTTTGTAA

Protein sequence

MDTAAKPSAV QPQNSSSAEV GTIVTGGERK VNPGPDPKND RKPTRTPDPK FKIFSGAANE 
PLAQEICAFL GIPLGQTKLT KFSDGEIYVQ ILENVRGGDI FLVQPTCHPV DHHLMQLLLM 
IDALKRASAR RITTVIPYFG YARQDRKDKP RVPVSAKLVA DLLTTAGADR ALVVDLHAPQ 
IQGFFNIPVD HLFGSPVLVD YFKKLELPDL TVVSPDAGGV ERARFFAKKM DSALAIVDKR 
RTDMNVTEVM HVIGDVHGRT CLILDDIIDT AGTLVKTAQA LADAGASEVY ACASHAVLSG 
EAINRISKSV LKELVVTNTI PLTDAGKAEP KIKVLSIAGL IARAIQSIHE ETSVSKLFL