Gene Ndas_3964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3964
Symbol
ID	9247835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4740154
End bp	4741722
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	73%
IMG OID
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003681867
Protein GI	297562893
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCAGC AGGCCATCAG GCGTGCGTTG ATCAGCGTCT ACGACAAGAC CGGTCTGGAG 
GAGCTGGGCA TCGGCCTGGC CGAGGCCGGG GTGGAGATCG TCTCCACCGG CTCCACCGCC 
GCGCGGCTGC GCGCCGCCGA CATCCCCGTC ACCCCCGTGG AGGACGTCAC CGGCTTCCCC 
GAGATCATGG AGGGTCGCGT CAAGACGCTG CACCCCTCCG TGCACGCCGG GCTCCTGGCC 
GACCAGAACA ACCCCGAGCA CGTCGCCAGG ATCAAGGAGC TGGGCATCGC CCCCTTCGAC 
CTGGTCGTGG TCAACCTCTA CCCCTTCCAG GACACCGTCG CCTCCGGCGC CTCCGAGGCC 
GACTGCATCG AGAAGATCGA CATCGGCGGC CCCGCCATGG TGCGCGCCTC GGCCAAGAAC 
CACGGCAGCG TCGCGATCGT GGTCGACCCG GGCAGCTACG ACGCCGCCCT GGAGGCCGTC 
CGCGACGGCG GCTTCACCCT GGAGCAGCGC AAGCGCCTGG CCGGGCTCGC CTTCCAGCAC 
ACCGCCGCCT ACGACGCGGC CGTCGCCGAC TGGTTCGCGG CCGACTACGC CCCCGACACC 
GAGGCCGCCG AGTCGGGCTG GCCCGGTTTC CTGGCCGCCG TCCACCACCG CAGGGACGTC 
CTGCGCTACG GCGAGAACCC CCACCAGAAG GCGGCGCTGT ACACCGTCGC GGGCGCCCCG 
CGGACCGGCC TGGCCGGAGC CGAGCAGCTC CACGGCAAGG CGATGTCCTA CAACAACTAC 
GTGGACGCCG ACGCCGCGCT GCGCGCCGCC CACGACTTCG ACCAGCCGTG CGTGGCCATC 
ATCAAGCACG CCAACCCGTG CGGGATCGCC GTCGGCGCCG ACAACGCCGA GGCCCACCGC 
AGGGCGCACG CCTGCGACCC GGTGTCGGCC TTCGGCGGCG TCATCGCCAC CAACCGCCCC 
GTCGGCGAGG AGCTGGCCGG GCAGATCGCG GAGATCTTCA CCGAGGTCGT CGTCGCCCCC 
GCCTTCGAGC CCGCGGCCGT GGAGATCCTC AGCCGCAAGA AGAACATCCG CCTGCTCGTG 
GCGCAGGGCT CCGGCCCCGG CGCGGGCGTG GAGCACCGCC AGATCAGCGG CGGCCTGCTG 
GTGCAGTCGC GCGACGCCAT CGACGCCCCC GGCGACGACC CCTCCACCTG GACCCTGGCC 
ACCGGCGAGC CCGCCGACGA GGCCACCCTG GCCGACCTGG CCTTCGCCTG GAAGGCCGTG 
CGCGCGGTCA AGTCCAACGC CATCCTCCTG GCCTCCGGCG GCGCCACCGT GGGAGTGGGC 
ATGGGCCAGG TCAACCGCGT GGACTCCGCA CGCCTGGCGG TCACGCGCGC GGGCGAGAGG 
GTGACGGGGT CCGTCGCGGC CAGCGACGCC TTCTTCCCCT TCCCCGACGG CCTGGAGATC 
CTCACCGGGG CGGGGGTCCG CGCCGTCGTC CAGCCCGGCG GCTCGGTCCG CGACGAGGAG 
GTCGTGGCCG CGGCCAAGGC GGCCGGCGTG ACCATGTACC TCACCGGGAC CCGGCACTTC 
TTCCACTGA

Protein sequence

MTQQAIRRAL ISVYDKTGLE ELGIGLAEAG VEIVSTGSTA ARLRAADIPV TPVEDVTGFP 
EIMEGRVKTL HPSVHAGLLA DQNNPEHVAR IKELGIAPFD LVVVNLYPFQ DTVASGASEA 
DCIEKIDIGG PAMVRASAKN HGSVAIVVDP GSYDAALEAV RDGGFTLEQR KRLAGLAFQH 
TAAYDAAVAD WFAADYAPDT EAAESGWPGF LAAVHHRRDV LRYGENPHQK AALYTVAGAP 
RTGLAGAEQL HGKAMSYNNY VDADAALRAA HDFDQPCVAI IKHANPCGIA VGADNAEAHR 
RAHACDPVSA FGGVIATNRP VGEELAGQIA EIFTEVVVAP AFEPAAVEIL SRKKNIRLLV 
AQGSGPGAGV EHRQISGGLL VQSRDAIDAP GDDPSTWTLA TGEPADEATL ADLAFAWKAV 
RAVKSNAILL ASGGATVGVG MGQVNRVDSA RLAVTRAGER VTGSVAASDA FFPFPDGLEI 
LTGAGVRAVV QPGGSVRDEE VVAAAKAAGV TMYLTGTRHF FH