Gene Ndas_0493 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0493
Symbol
ID	9244334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	593692
End bp	594948
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	66%
IMG OID
Product	putative oxygenase subunit protein
Protein accession	YP_003678446
Protein GI	297559472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGA TCCTTATCGT CGGCGCGGGC CACGCCGGCC TGCACCTGGC CCATGGGCTC 
CTCACCCATG GATACGACGT CACGGTGATC ACGGGGCAGT CCTCGATGGA GATCCGGACC 
GGTCGTTGCT CGGTCGCCCA GTTCACCTTC CCCACCGCTC TGGAGTACGA GCGCAAGTTC 
GACCTCGACT TCTGGAGTGC GCTGGCTCCC CAGATCCGTG AGCAGAAGCT GTTCATGTAC 
ATGGAGGGCG GGGTGTCGAG CGCTTTCAGC GGTAGCTCGC ATCCGGGCAA CGGTTACTCC 
GTCTCGGTCG ACCGCCGGGT GAAGATGGCC GACTGGCTGG AGTTCTTCGA GGACCGGGGA 
GGCAAGGTGG TGATCCACGG GGTCACCGTC ACCGATCTGG ACTACTTCTC GCGGATGTTC 
GACCTGATCA TCGTGGCCGT CGGCCACGGT GAGCTGGGAC AGCTCTTCGA CAACGACACG 
AGCCGCTTCA GCGGTGCCAG GCCCCGCTCC ATCGCCCAGG CACACATCTA CGACGTGTGG 
CCCGACCCCG AGGGCGACGA CAACATCGGC TGGGCGGCCA CGGCCCAGAG CGCGGGCAAC 
CTCATGCTCA TCCCGATGCT CGGCCAGGAC GGGCCCTGCC ACAACCTCCT GCTCGTGGAC 
CGCAAGGGCG GTCCGATGGA CGCCTGGCCG GACCGGCCAG GCCAGGAGGA GCAGCTGCGC 
CGGATGAAGG ACCTGCTGAG GAAGCACGCG CCCGACGCCT TCGAGCGGAT CAAGGACGCC 
AACCTCACCG ACGGCCGCAG CACACTGGTC GAGGAGCTCA CGCCGCAGGT CCGCAACCCG 
GTGGGCAAGC TGCCCAACGG GGGCAGCGTC CTGGGCATGG CCGACGTGGT GGTCACCATG 
GACCCCTACA CCGGACAGAG CTGGAACAAC TCCACCCGGT GCGCCCAGGC CTACCTGGAG 
GCGATCATCG AACGCGGCGA CCAGCCCTTC GACGACGACT TCCTGGTCGC GGCGTTCGAC 
CGTTTCTGGG AATTCGGTCA GGACAATCAG GAGTGGGCGG AGTTCGCCTC CACGCTGTGG 
GAGCGCGAAC TGCCTCCCCA CCTGGGAGTG GTGATGGAGG CCGCCGCCCG TTACCGCGAG 
GTCGGCGACC GTTGGATCCA GGCGTGGGAC AACCCCTCCG ACTTCAAGAA CTGGCTGTTC 
AACCCGGAGG CCGCCATGCG GTACATCGAG GAGGTCAAGG AGAGGCACGG GGACTGA

Protein sequence

MRKILIVGAG HAGLHLAHGL LTHGYDVTVI TGQSSMEIRT GRCSVAQFTF PTALEYERKF 
DLDFWSALAP QIREQKLFMY MEGGVSSAFS GSSHPGNGYS VSVDRRVKMA DWLEFFEDRG 
GKVVIHGVTV TDLDYFSRMF DLIIVAVGHG ELGQLFDNDT SRFSGARPRS IAQAHIYDVW 
PDPEGDDNIG WAATAQSAGN LMLIPMLGQD GPCHNLLLVD RKGGPMDAWP DRPGQEEQLR 
RMKDLLRKHA PDAFERIKDA NLTDGRSTLV EELTPQVRNP VGKLPNGGSV LGMADVVVTM 
DPYTGQSWNN STRCAQAYLE AIIERGDQPF DDDFLVAAFD RFWEFGQDNQ EWAEFASTLW 
ERELPPHLGV VMEAAARYRE VGDRWIQAWD NPSDFKNWLF NPEAAMRYIE EVKERHGD