Gene Namu_4218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4218
Symbol
ID	8449844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4662984
End bp	4664246
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	73%
IMG OID	645043267
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_003203496
Protein GI	258654340
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0535465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.208178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGAAC GCACCGGCAT GCCCCGGGTC GGGATGGTCG GTGGCGGCCA GCTGGCCCGG 
ATGACCCATC AGGCGGCCAT TCCGCTCGGC CAGACCCTGC GGGTGCTCTC GATCTCGGCC 
GAGGAGAGCG CGGCCCTGGT CACGCCGGAC GTGATGATCG GCCATCACAC CGACCTGGAT 
GCCCTGCGCC GGTTCGCGCA GGGGTGCGAC GTCGTCACCT TCGATCACGA GCATGTGCCC 
GGTGAACACA TCCGCACCCT GGTCGCCGAA GGCTTTGCCG TGCACCCGGG CGCGGACGCA 
CTGCAATTCG CGCAGGACAA GGCGCTGATG CGCACCCGGT TGGCCGAACT CGGGGTGCCG 
GTCCCGGCCT TCGCGGTGAT CGCGGCCGAC GACCCGGCCC GTGACGACCG GATCGTGGCG 
TTCGGCGACG CGCACGGTTG GCCCTGCGTG GTCAAGACCG CGCGCGGCGG GTACGACGGC 
CGCGGGGTGT GGGTGGTGCG GTCGGCGACC GAGGCGCCCG AGCTGGACCT GCCGGACGGG 
GGCCAGCTGG TGCTGGAGGC CTTCGTGCCG ATGCGCCGGG AGCTGGCCGC CGTGGTCGCC 
CGGTCGCCCT TCGGCCAGGC CGCGGCCTGG CCGGTGGTGC AGACCGTCCA GCAGGACGGG 
ATCTGCGTCG AGGTGATCGC CCCCGCACCC GGACTGGACG GCGACGTCGC GTCGGCGGCC 
GGGCGGCTGG CCCTGCAGGT CGCCGGGGAG CTCGGCGTCG TCGGCATCCT GGCCGTCGAG 
CTGTTCGAGG TCGACCCCGG ACCGGACGCG CCCGACGGGA TCCTGGTCAA CGAGTTGGCC 
ATGCGCCCGC ACAACTCCGG CCACTGGTCA ATGGACGGGG CGGTGACCGG CCAGTTCGAG 
CAGCACCTGC GGGCCGTCCT GGACTACCCG CTGGGCCGCA CCGACCTGCT CGCCCCGTTC 
ACCGTGATGG GCAACGTGCT CGGTGGCCCG GCCGACGGCC CCGGTGCGGG CATCGGCATG 
GACGAGCGTG TCCATCACCT GGCTGCCCGG TTCCCGCAGG TCAAGGTGCA TCTATACGGC 
AAGGCTTTCC GGCCCGGGCG CAAGCTCGGG CATGTCAATG TGCTCGGCTC GGATCTGGGT 
GAGCTGCGGC GCGTCGCCGC GCTGGCCGCG ACCTGGCTCA GCGAAGGCGT GTGGGCCGAC 
GGTTGGAACG CCCATGCCGC CGATCCCCGC GCAGCACGAC CGCAGGAGGT GGCGGCGCGA 
TGA

Protein sequence

MDERTGMPRV GMVGGGQLAR MTHQAAIPLG QTLRVLSISA EESAALVTPD VMIGHHTDLD 
ALRRFAQGCD VVTFDHEHVP GEHIRTLVAE GFAVHPGADA LQFAQDKALM RTRLAELGVP 
VPAFAVIAAD DPARDDRIVA FGDAHGWPCV VKTARGGYDG RGVWVVRSAT EAPELDLPDG 
GQLVLEAFVP MRRELAAVVA RSPFGQAAAW PVVQTVQQDG ICVEVIAPAP GLDGDVASAA 
GRLALQVAGE LGVVGILAVE LFEVDPGPDA PDGILVNELA MRPHNSGHWS MDGAVTGQFE 
QHLRAVLDYP LGRTDLLAPF TVMGNVLGGP ADGPGAGIGM DERVHHLAAR FPQVKVHLYG 
KAFRPGRKLG HVNVLGSDLG ELRRVAALAA TWLSEGVWAD GWNAHAADPR AARPQEVAAR