Gene Namu_1272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1272
Symbol
ID	8446868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1396376
End bp	1397947
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	73%
IMG OID	645040406
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003200665
Protein GI	258651509
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0665315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.630198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCC AGGACGGGCG TCGGCCCATC CGGCGGGCCC TGCTGTCGGT GTCGGACAAG 
TCCGGCCTGC TGGAGTTGGC CGCCGCGCTG CACGCCGCCG GGGTGAGCAT CGTGTCCACC 
GGCGGGTCGG CCCGGGCGAT CGCCGACGCC GGCATCCCGG TCACCCCGGT CGAGCAGGTG 
ACCGGCTTCC CGGAGTGCCT GGACGGCCGG GTCAAGACCC TGCACCCGGC GATCCACGGC 
GGCCTGCTGG CCGACACCCG GCTGCCCGAC CACCTGCGCC AGGCCGACGA GCTGGGCATC 
GAGCTGTTCG ACCTGGTGGT GGTCAACCTC TACCCGTTCC GGCAGACCGT GCGCTCGGGC 
GCCTCGTTCG ACGAGTGCGT CGAGCAGATC GACATCGGTG GCCCGGCCAT GGTCCGGGCC 
TCGGCCAAGA ACCACCCGTC GGTGGCGGTG GTGGTCGACC CGGCGCGCTA CCCCGACATC 
GAGCAGGCGC TGGCCGACGG CGGGTTCACC CTGGCCCAGC GGGCGGCGCT GGCCGCGGCC 
GCGTTCGCGC ACACCGCCGC CTACGACATC GCCGTCGCCT CCTACCTGGG CGGGGCGACG 
ACCGGAGCCG ACGGCTGGCC CGAGTTCACC GGGGCGAGCT GGGACAAGAT GTCCACGCTG 
CGCTACGGGG AGAACCCGCA CCAGGCGGCG GCGCTGTACC GGCACTGGCG GGTCGGGCTG 
GCCTCGGCCG AGCAGCTCCA CGGCAAGGAA ATGAGCTACA ACAACTACGT CGACGTGGAC 
GCCGCCTGGC GGGCCGTCGG CGACTTCGCC GATCCGGCCG TGGCCGTGGT CAAGCACGCC 
AATCCCTGTG GCATCGCCGC GGTGACCGGT GGCGCCGACG ACACGATTGC CCGGGCCCAC 
CGGCTCGCCC ACGCGTGCGA CCCGGTGTCG GCCTTCGGCG GGGTGATCGC CGCGAACCGC 
CCGGTGACCA TGGAGATGGC CGAGCAGATC GCCGACGTGT TCACCGAAGT GGTGCTCGCC 
CCGGCTTTCT CGGCCGACGC GGTGACGGTG CTGACCCGCA AGAAGAACAT CCGGCTGCTG 
GTCATGCCGG AGGGCGCCGC GCCCGATCCG ATCGAGTTCC GGTCGATTTC CGGCGGGGTG 
CTCGCGCAGC GCCGGGACCA GCTGGACGCC CCCGGCGACG ATCCGGCGAC CTGGACCCTG 
GCCGCCGGCC CGGCGGTGGA CGAGGCGACG CTGGCCGACC TGGTCTTCGC CTGGCGGGCC 
TGCCGATCGG TGAAGTCCAA CGCCATCCTG CTGGCCGCCG ACGGCGCGTC GGTGGGCATC 
GGCATGGGGC AGGTCAACCG GGTCGATTCG GCTCGGCTGG CCGTGGAACG GGCGGGGGAG 
CGGGCCCGTG GTTCGGTCGC CGCGTCCGAC GCGTTCTTCC CGTTCGCCGA CGGCCCGGAG 
ATCCTGATCG CCGCCGGGGT GCGGGCGATC GTGCAGCCCG GCGGTTCGGT CCGCGACCCC 
GAGGTCATCG CGGCGGCCGA GCAGGCCGGG GTCAGCATGT ACTTCACCGG GACCCGCCAC 
TTCTTCCACT GA

Protein sequence

MSTQDGRRPI RRALLSVSDK SGLLELAAAL HAAGVSIVST GGSARAIADA GIPVTPVEQV 
TGFPECLDGR VKTLHPAIHG GLLADTRLPD HLRQADELGI ELFDLVVVNL YPFRQTVRSG 
ASFDECVEQI DIGGPAMVRA SAKNHPSVAV VVDPARYPDI EQALADGGFT LAQRAALAAA 
AFAHTAAYDI AVASYLGGAT TGADGWPEFT GASWDKMSTL RYGENPHQAA ALYRHWRVGL 
ASAEQLHGKE MSYNNYVDVD AAWRAVGDFA DPAVAVVKHA NPCGIAAVTG GADDTIARAH 
RLAHACDPVS AFGGVIAANR PVTMEMAEQI ADVFTEVVLA PAFSADAVTV LTRKKNIRLL 
VMPEGAAPDP IEFRSISGGV LAQRRDQLDA PGDDPATWTL AAGPAVDEAT LADLVFAWRA 
CRSVKSNAIL LAADGASVGI GMGQVNRVDS ARLAVERAGE RARGSVAASD AFFPFADGPE 
ILIAAGVRAI VQPGGSVRDP EVIAAAEQAG VSMYFTGTRH FFH