Gene Nham_1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_1235
Symbol
ID	4032229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	-
Start bp	1393177
End bp	1394292
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	66%
IMG OID	637969714
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_576523
Protein GI	92116794
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGATT CTCGGCGGGT GACGCTTCAG CCGGGCGACA CCATCGGAAT TCTCGGCGGC 
GGACAACTCG GCCGGATGCT GGCGTTGGCG GCGGCGCGCC TGGGCCTCAA GTGCCAGGTG 
TTCTCGCCAG ATCCGGACTC GCCGGCGTTC GACGTCGTGC AGAACGCCAC CTGTGCCGAA 
TACGCCGACG TCGAGGCGCT GGAATTGTTC GCAGCCGACG TCGACGTCGT CACCTATGAA 
TTCGAGAATG TCCCGGCGGC GACCGCGATG GTGCTCGCCG CGCGCCGGCC GGTGCTACCC 
AACCATCGCA TTCTGGAGAC GGTGCAGGAC CGGCTGGTTG AGAAGAACTT CATCACCGGA 
CTCGGTATCG GCACCGCCGC CTATACCGAC GTGGCGTCGG CGGAGGCGTT GCGCGAGGCG 
ATCGAAATCA TCGGCCTTCC GGCGGTGATC AAGACCCGCC GCTTCGGCTA CGACGGCAAA 
GGTCAGGCCA TCATTCGCGA GGGAGACGAT CCCAGCCAGG TGTGGGACGA TCTCGGCACC 
AAGGCGGCGA TCCTGGAAGC CTTCGTAGCG TTCGAGCGCG AGATTTCCGT GATCGTCGCG 
CGCAGCGCCG ATGGCGGCGT CGAATGCTTC GACGTGACCG AGAACGAGCA TCGCGATCAC 
ATCCTGAAAT ATTCGCGCGT ACCAGCGGCG ATCCCCGATA CGCTCGCCGC TCAGGCGCGC 
GACATCGCGC AAAAGATCGC GATCGCGCTC GACTATGTCG GCGTACTGGC CGTCGAGATG 
TTCGTGGTGC CGGGCGCCGG CGGGCCGACG CTGCTCGTCA ACGAGATCGC GCCGCGGGTC 
CACAACTCCG GGCACTGGAC GCTCGACGGC GCCTCGATTT CGCAATTCGA GCAGCACATC 
CGCGCGGTCG CCGGCTGGCC GCTCGGCAAG CCGGTCCGGC ACGGCAGCGC AGTCATGACA 
AACCTGATCG GCGACGACAT CCTCGACTAC GGGAAGTGGC TCACCGTGCC GGGCGCAGCC 
GTGCATATCT ACGGCAAGGG CGCGCCGCGC CCCGGCCGCA AGATGGGCCA TGTCACCGAG 
ATCAAGCATG TCACCGAGGT CAAGGGCCGC GGCTGA

Protein sequence

MSDSRRVTLQ PGDTIGILGG GQLGRMLALA AARLGLKCQV FSPDPDSPAF DVVQNATCAE 
YADVEALELF AADVDVVTYE FENVPAATAM VLAARRPVLP NHRILETVQD RLVEKNFITG 
LGIGTAAYTD VASAEALREA IEIIGLPAVI KTRRFGYDGK GQAIIREGDD PSQVWDDLGT 
KAAILEAFVA FEREISVIVA RSADGGVECF DVTENEHRDH ILKYSRVPAA IPDTLAAQAR 
DIAQKIAIAL DYVGVLAVEM FVVPGAGGPT LLVNEIAPRV HNSGHWTLDG ASISQFEQHI 
RAVAGWPLGK PVRHGSAVMT NLIGDDILDY GKWLTVPGAA VHIYGKGAPR PGRKMGHVTE 
IKHVTEVKGR G