Gene BBta_6849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_6849
Symbol	purK
ID	5152229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	7172903
End bp	7174018
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	65%
IMG OID	640561531
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_001242642
Protein GI	148258057
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.768888
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGT CCAATCGGGT GAAGCTGAAG CCCGGCGACA CGATCGGCAT TCTCGGCGGC 
GGCCAGCTCG GCCGCATGCT GGCGCTGGCG GCGGCGCGGC TCGGGTTGCG CTGCCAGGTG 
TTCTCGCCGG ACCCGGATTC GCCGGCATTC GATGTCGTCC TGAACGCAAC CTGCGCCGAA 
TATGCCGATG TCGAAGCGCT CGAATTGTTC GCCAACGACG TCGATGTCGT GACCTATGAG 
TTCGAAAACG TGCCATCGGC CGCTGCCATG GTGCTGGCTG CCAGACGTCC CGTGCTGCCG 
AGCCGCTCGG CGCTCGAAAC CACGCAGGAT CGGCTCACGG AAAAGGATTT CGTGACCTCG 
CTCGGCATCC GAACGGCCAA TTACGCCGAT GTCTCCTCGC CATCCACGCT GCGCGAAGCG 
ATCCTGCGGA TCGGCCTGCC GGCCGTGCTC AAAACCCGCC GCTTCGGCTA TGACGGCAAA 
GGTCAGGTGA AGATCCGCCA GGGCGATGAC CTGGAAAAAC TGTGGGCTGA GCTCGGTACC 
AAATCCGCCA TTCTGGAAGC CTTCGTCCCG TTCGAGCGCG AGATCTCGGT GATCGCCGCG 
CGGGGGGCTG ACGGACAGGT CGAGTGTTTC GACGTCACGG AAAACGAGCA TCGCGATCAC 
ATTCTGAAAG TGTCGCAGGC GCCGGCCCGC ATCCCGGACA CGCTGGCCGA CGAGGCTCGC 
CACATTGCCA GCCGGATCGC CACCGCGCTC GATTATGTCG GCGTCCTGGC TGTCGAGATG 
TTCGTCGTGC CCGGCCCCTC CGGCCCCGGC GTGCTGGTCA ACGAGATTGC CCCACGGGTG 
CATAATTCCG GCCACTGGAC CTTGGATGGG GCGTCGATTT CGCAATTCGA GCAGCACATC 
CGGGCGATCG CGGGCTGGCC GCTTGGCAAG CCGCTGCGCC ACGGGCAGGT CACGATGACC 
AATCTGATCG GCGACGAGAT CAACAGCTAC GAGCAATGGC TCACGGTTCC CGGCGCCACC 
GTGCACCTCT ATGGCAAGGG GGCGGCCCGG CCGGGCCGCA AAATGGGGCA TGTCACCCAG 
GTGTCCCCGA TGCCGCCAAG GGCGGGCCTG AAATAA

Protein sequence

MSGSNRVKLK PGDTIGILGG GQLGRMLALA AARLGLRCQV FSPDPDSPAF DVVLNATCAE 
YADVEALELF ANDVDVVTYE FENVPSAAAM VLAARRPVLP SRSALETTQD RLTEKDFVTS 
LGIRTANYAD VSSPSTLREA ILRIGLPAVL KTRRFGYDGK GQVKIRQGDD LEKLWAELGT 
KSAILEAFVP FEREISVIAA RGADGQVECF DVTENEHRDH ILKVSQAPAR IPDTLADEAR 
HIASRIATAL DYVGVLAVEM FVVPGPSGPG VLVNEIAPRV HNSGHWTLDG ASISQFEQHI 
RAIAGWPLGK PLRHGQVTMT NLIGDEINSY EQWLTVPGAT VHLYGKGAAR PGRKMGHVTQ 
VSPMPPRAGL K