Gene Plav_2071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2071
Symbol
ID	5456868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	2256428
End bp	2257537
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	67%
IMG OID	640877648
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_001413342
Protein GI	154252518
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	4.39377e-16
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCGACCA TTCCACCCGG CGGGACCATC GGCATTCTCG GCGGCGGCCA GCTTGGGCGG 
ATGCTGGCGA TGGCGGCGGC GCAGCTGGGG CTCGCCACGC ATATCTATTG CCCGGATGAG 
GAATTGCCCG CGGCGGATGT GGCCGGCGAG GTCACGCGCG CGGCTTATGA CGACGAGGCG 
GCGCTGGTGC GCTTTGCCGG GAGCGTCGAG GTCGTCACTT ATGAATTCGA GAATGTGCCG 
GCGGAGACGG CGCGCATTTT GAGCGAGCGC GGCATCGTGC GGCCTGGGCC GCTTGCGCTG 
GCGACGGCAC AGGACCGCGT GGTCGAAAAG AATTTCCTCG TGAGCCACGG CATCGCGACC 
GCACCCTTCG CGGATGTGGC GGACGAAGCG GGCCTGCGCA GCGCCATGGA AGCGATCGGC 
ACGCCGTCGA TCCTGAAGAC GCGGCGCTTC GGCTATGACG GCAAGGGACA GGCGAAGATC 
GCATCGGCGG CGGACGCGCT TGCCGCCTAT GACGAGATCG GCCGCGCCCC CGCCATCCTC 
GAAGGCTTCG TGCCCTTCGA ACGGGAAATC TCCGTGATCG TCGCACGCGG GCTCGATGGA 
CGGACGGCGG CTTACGATCC CGTCGAGAAC ATCCACAAGA ACCACATTCT CGACCGCACG 
CTGGCGCCCG CCGCGCTGAC CAGGGCGCTT TCCGACGAGG CCTGCGCAAT CGCGGCGCGC 
ATCGTCTCCG AACTCGATTA TGTGGGCGTG ATGGGCGTCG AGCTGTTTCT GCTGCCGGAA 
AGCGGAAGCA AGAGGCGGCT GCTCGTCAAC GAGATCGCGC CGCGCGTCCA CAATTCCGGC 
CACTGGACGA TGGATGCCTG CGCAGTGAGC CAGTTCGAGC AGCATATTCG CGCGATCTGC 
GGCTGGCCGC TTGGAAGCCC GGCGCGCCAC TCCGACGCGG TGATGACCAA TCTGATCGGC 
GAAGAGGCGG CGGATTGGGC GCGGCTCGCG GCGACGCCGG ACACGGCCCT CCATCTCTAC 
GGCAAGCGGG AAGCCCGGCC CGGCCGCAAG ATGGGCCATG CGACAAGGCT TTACCCGCTC 
GGAACACGGC CGCCGGTTAC GCCTTCTTAA

Protein sequence

MATIPPGGTI GILGGGQLGR MLAMAAAQLG LATHIYCPDE ELPAADVAGE VTRAAYDDEA 
ALVRFAGSVE VVTYEFENVP AETARILSER GIVRPGPLAL ATAQDRVVEK NFLVSHGIAT 
APFADVADEA GLRSAMEAIG TPSILKTRRF GYDGKGQAKI ASAADALAAY DEIGRAPAIL 
EGFVPFEREI SVIVARGLDG RTAAYDPVEN IHKNHILDRT LAPAALTRAL SDEACAIAAR 
IVSELDYVGV MGVELFLLPE SGSKRRLLVN EIAPRVHNSG HWTMDACAVS QFEQHIRAIC 
GWPLGSPARH SDAVMTNLIG EEAADWARLA ATPDTALHLY GKREARPGRK MGHATRLYPL 
GTRPPVTPS