Gene Ndas_4388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4388
Symbol
ID	9248263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5222392
End bp	5223456
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	73%
IMG OID
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_003682283
Protein GI	297563309
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGCCG AAAGCACGGG GACGTCGGGC GCGTACGCGG CCGCCGGGGT GGACATCGCC 
GCCGGCGAAC GCGCCGTCGA CCTGATGAAG CGCCACGTGG CGCGCACCCG CAGGCCCGAG 
CAGGTGACCG ACGCCAGCGG CTTCGCGGGC CTGTTCCGGC TCGACACGAA CAAGTACAAG 
GACCCGGTCC TGGCGACCTC CACCGACGGC GTGGGCACCA AGGTGATGCT CGCCCAGCAG 
ATGGACCGGC ACGACACGAT CGGCATCGAC CTGGTGGCGA TGGTCGTCGA CGACCTCGTG 
GTCAGCGGCG CCGAGCCCCT GTTCATGACC GACTACGTCG CCTGCGGCGC GGTGGTGCCC 
GAGCGCATCG CCGAGATCGT CGGCGGCATC GCCGAGGGCT GCCACCAGGC GGGCTGCGCG 
CTGGTCGGCG GTGAGACCGC CGAGCACCCG GGCGCCATGG AGCCGGACGA GTACGACCTG 
GCCGGTGCGG GCACCGGCGT GGTGGAGGGC GACGCGATCC TGGGCCAGGA CCGGGTCCGC 
GAGGGCGACG CCGTCATCGC GATGGGCTCC TCGGGCCCGC ACTCCAACGG CTACTCGCTC 
GTCCGCAGCA TCGTGGACCG GGCGGACCTG GACCTGTTCG CGCACGTCCC TGAGCTGGAC 
GGGGTGCTGG GCGAAGTGCT GCTCACCCCG ACCCGGGTGT ACGCCAAGGA CTGCGTGGCG 
CTGACCGCGG CAGTGGAGGT GCACGCCTAC GCGCACATCA CCGGCGGCGG GCTGGCGGCC 
AACCTGGCGC GCTCACTGCC CGACCACCTG GACGCGGAGC TGGACCGCTC CACCTGGGCA 
CCCGCCCCCG TGTTCGGCTA CCTGGCCGAC AAGGGGGGCG TGGGCCGGGA GGACATGGAG 
GCCACGTTCA ACATGGGTGT GGGCATGGCG GCGATCGTCG CGGCGGACGA CGCCGAGCGC 
GCCCTGCGGG TACTGTCCGA CCGCGGCGTC CCGGCCTGGC GGCTGGGCAC GGTGACGGCC 
GGTTCGGGAC GGGCCGTCCT GACCGGCGAG TACCGCGGCG CGTGA

Protein sequence

MAAESTGTSG AYAAAGVDIA AGERAVDLMK RHVARTRRPE QVTDASGFAG LFRLDTNKYK 
DPVLATSTDG VGTKVMLAQQ MDRHDTIGID LVAMVVDDLV VSGAEPLFMT DYVACGAVVP 
ERIAEIVGGI AEGCHQAGCA LVGGETAEHP GAMEPDEYDL AGAGTGVVEG DAILGQDRVR 
EGDAVIAMGS SGPHSNGYSL VRSIVDRADL DLFAHVPELD GVLGEVLLTP TRVYAKDCVA 
LTAAVEVHAY AHITGGGLAA NLARSLPDHL DAELDRSTWA PAPVFGYLAD KGGVGREDME 
ATFNMGVGMA AIVAADDAER ALRVLSDRGV PAWRLGTVTA GSGRAVLTGE YRGA