Gene Ndas_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2998
Symbol
ID	9246851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3582023
End bp	3583561
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	78%
IMG OID
Product	formiminoglutamate deiminase
Protein accession	YP_003680914
Protein GI	297561940
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.558818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACCG GCGCGGACTC CGGCCCCGCC GCCTCCGCCC CCGGCGGGAG CGCCGGTCCT 
GCGGCATGCG GAACCGCCTC CGGGCGTTCC CGGGGGCCGC GCGACCACCG CCTGTGGTGC 
GAGTGGGCGT GGACCGGCGC CGAGGACGGC ACTCCCGAGC ACGGCGTGCT CGTGGAGGTG 
GCCGACGGCC GCATCACGTC GGTGACGGTC GCGACGCCGC GCCCCGGGGA CGCCGAGACC 
CTCACCGGCC TCACCCTGCC CGGGCTCGCC AACGCCCACT CGCACGCCTT CCACCGGGCG 
CTGCGGGGGC GCACCCACGC CGGCGGCGGA TCCTTCTGGA CCTGGCGCGA GACCATGTAC 
CGCGTTGCCG AGCGGCTGGA CCCCGACACC TACCACCGAC TCGCCCGGGC GGTCTACGTC 
GAGATGGCCC TGGCCGGGAT CACCTGCGTG GGCGAGTTCC ACTACCTGCA CCACGCACCC 
GGCGGGGATC GCTACGCCGA CCCCAACGCC ATGGGCCACG CCCTGGCGGC CGCCGCGGCC 
GACGCGGGGA TCCGGATCAC CCTGCTGGAC GTGTGCTACC TGTCCGGCGG GCTGGACGGG 
AACGGCGTCC ACCAGCCGCT GGCCGGGCCC CAGCTGCGCT TCGGCGACGG GGACGCGGAC 
GGGTGGGCCG AACGCGCCGC CGCCTTCCGT CCCGGGGGCG GGCACGTGCG CACGGGAGCG 
GCCGCCCACT CGGTGCGCGC CGTCCCCGCC GCGCAGCTGC CCGAGGTGGC CGCTTTCGCC 
GCCGGGCGCG ACGCCGTGCT GCACGTCCAC GTCTCCGAGC AGCCCGGTGA GAACGCCGCC 
TGCCTGGCCG CCTACGGCCG CACCCCCACG GCCGTGCTCG CCGACGCGGG CGCGCTCACC 
CCGCGCACCA GCCTGGTGCA CGCCACCCAT CTGAGCGACG CCGACGTGGC GGCCGTCCGC 
GCGGCCGGGT CCACGGTGTG CCTGTGCCCC ACGACCGAGC GCGACCTGGC CGACGGCCTG 
CCGCGCACCG GCGACCTGCT GCCCGCCCCG CTCAGCCTGG GCACCGACCA GCACGCCCTG 
ACCGACATGT TCGAGGAGGC CAGGGCGGTC GAACTCCACG AGCGCCTGCG CACCCACCGG 
CGCGGCACCC TGGGCGCCGG GGAGCTGCTG CGCGCGGCCA CCGCGCACGG GCACGCCAGC 
CTCGGCTGGA CCCGCGAACC GGGGGCCGCC GCCCCCGGGG CGTCCGAGGG GTCGGCGCAC 
GTCGGAGCGG GACCACAGGA ACCCCCGCGC GGGGCTTCCG ACGCCGGTGT CCTGGCCCCC 
GGGGCGCGGG CCGACCTGGT CAACGTCCCC CTGGACGGAA CCCGCCTGGC CGGGGCCGAC 
CCCGCCCGGG CCGCCGACGC CGTCGTCTTC GCCGCCGCCT CCGCCGACGT GCGGCACGTG 
ATGGCCGACG GGCGCTGGAC CGTCCGCGAC GGCGTCCACA CCCTGGTTCC CGACACCGCG 
CGCGAACTCG ACACGGTCAT CAAGGAGGTC CTCACATGA

Protein sequence

MTTGADSGPA ASAPGGSAGP AACGTASGRS RGPRDHRLWC EWAWTGAEDG TPEHGVLVEV 
ADGRITSVTV ATPRPGDAET LTGLTLPGLA NAHSHAFHRA LRGRTHAGGG SFWTWRETMY 
RVAERLDPDT YHRLARAVYV EMALAGITCV GEFHYLHHAP GGDRYADPNA MGHALAAAAA 
DAGIRITLLD VCYLSGGLDG NGVHQPLAGP QLRFGDGDAD GWAERAAAFR PGGGHVRTGA 
AAHSVRAVPA AQLPEVAAFA AGRDAVLHVH VSEQPGENAA CLAAYGRTPT AVLADAGALT 
PRTSLVHATH LSDADVAAVR AAGSTVCLCP TTERDLADGL PRTGDLLPAP LSLGTDQHAL 
TDMFEEARAV ELHERLRTHR RGTLGAGELL RAATAHGHAS LGWTREPGAA APGASEGSAH 
VGAGPQEPPR GASDAGVLAP GARADLVNVP LDGTRLAGAD PARAADAVVF AAASADVRHV 
MADGRWTVRD GVHTLVPDTA RELDTVIKEV LT