Gene Ndas_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2016
Symbol
ID	9245866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2436030
End bp	2437061
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	76%
IMG OID
Product	Pirin domain protein
Protein accession	YP_003679948
Protein GI	297560974
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.656131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAATC TGGACACCCA TCCCGCCGAA GAGCGCGTCT GCGGCGGAGA GGTCGACCCC 
GCCGACACCG CCGCCTCCGG CGACACCGAA CTCCTCGAAC CGCGCGAGGT CCCGCTCGGC 
GGCCCGCGCG CCATGCTGGT CCGCCGCGCC CTGCCCGGGA AGAACCGCCG CATGGTCGGC 
GCGTGGTGCT TCGCCGACGT CTACGGACCC ACCGGCGTCG CCGACGGCCC CGGCATGCAG 
GTGCCGCCGC ACCCCCACAT CGGCCTGCAG ACCGTGAGCT GGCTGGTCCG GGGGTCGGTC 
CACCACATGG ACGGACTGGG CTCGGACCAG CTGGTCCGCC CCGGCCAACT CAACCTCATG 
ACCGCCGGAC ACGGCATCGC CCACTCCGAG CGCTCCCCCG CCGACGCCCC GCCGCTGCTG 
CACGGCGCCC AGCTGTGGAT CGCCCTGCCC GAGGACGACC GCGAGGGACC GGCCCGCTTC 
GAACACCACG CCGACCTGCC CGCCTTCGAC CTGCCCGGCA CGGACGCGCC GGGGGCCAGG 
GTCACGGTGA TCGCCGGAGA GGTGGACGGC CGCCGCTCCC CCGCCCGCGT GCACACCCCG 
CTCATGGGAG CCGAGGTCGT GCTGGAACCC GGGGCCCGGG TGCGCCTGCC CCTGGACGCG 
TCCTTCGAAC ACGGCGTCCT GCCCCTGGAC TCGCCCGTGC GGGTCCTGGG CCACACCGTC 
GAGGCCGGTG CGCTGCTCTA CGCGGGCGAG GGGCGCACGG AGGTGGAACT GCGGGCCGAG 
GAGACCGCGC ACGTGCTGGT GATCGGCGGC GAGCCCTTCA CCGAGGACCT GGTCATGTGG 
TGGAACTTCG TCGGCCGCGA CCACGACGAG ATCGTGCGGG CCCGCCGCGC CTGGGAGGAC 
GACCGGGAGG ACGCCGACGA CGCGGGCGGG CGGCGCTTCG CCGCGGTCGC GACCGACGAC 
GGAGCACCCC TCCCGGCTCC GGAGCTGCCC AACGCGCGCC TGCGCGCGCG CCCGCGCCAC 
CGCGGCGCGT AG

Protein sequence

MSNLDTHPAE ERVCGGEVDP ADTAASGDTE LLEPREVPLG GPRAMLVRRA LPGKNRRMVG 
AWCFADVYGP TGVADGPGMQ VPPHPHIGLQ TVSWLVRGSV HHMDGLGSDQ LVRPGQLNLM 
TAGHGIAHSE RSPADAPPLL HGAQLWIALP EDDREGPARF EHHADLPAFD LPGTDAPGAR 
VTVIAGEVDG RRSPARVHTP LMGAEVVLEP GARVRLPLDA SFEHGVLPLD SPVRVLGHTV 
EAGALLYAGE GRTEVELRAE ETAHVLVIGG EPFTEDLVMW WNFVGRDHDE IVRARRAWED 
DREDADDAGG RRFAAVATDD GAPLPAPELP NARLRARPRH RGA