Gene Ndas_4583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4583
Symbol
ID	9248464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5431737
End bp	5433152
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	71%
IMG OID
Product	putative cytochrome P450
Protein accession	YP_003682476
Protein GI	297563502
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC CCGCTTCTCC CCTCCGTCAC CGCACCGGCA CACCATCTCC CCGAAGAGAA 
GGACTCGGTT CGTTGACGAC CACACGGCTG TACGGCACCA CACCCGCCAC CGGACGCGAC 
GGCCTCTGGG CCGCGCTGCG CGAACGCCAC GGACCCGTGG CCCCGGTCGA ACTGGAGACC 
GGCGTACGGG CCTGGCTTCT GCTGGGCTAC CACGAGAACC TCGCCGTGTT ACAGAACCAG 
CACCTCTTCT CGCGCGACAC CCGCCGCTGG CGCGAGGTGG TCGAGGGGCG CGTCGACCTC 
GCCTGCGCCC GGCCCGCGCT GTCCTGGCGC CCCAACGCCC TGTACGCCGA CGGGGCCGAG 
CACACCCGGC TGCGCTCGGC CATCGCGGAC AGCCTGGCCA GGGTGGACAT GAACGCCACC 
GCCCGCACGA TCCGGCGGAT CGCCGACGAA CTCATCGACT CCTTCGTCGC CGACGGCAGG 
GCCGACCTCA TCTCCGAGTA CGCCAATCCC CTGCCCGTGC TCGTGGTCAA CAGCCTGTAC 
GGGCTCTCCG ACAGCTACGG GTACATGCTG GGCGACCTCA CGTCCATCGT CTTCAGCGAG 
AACGCCGAAC GCGCCGAGGA CGCCGTCGGC CGCATCCACC AGTACTTCTC CGAACTGGTG 
GCCCGCAAGC GCAGGATCCC CGGTCAGGAC CTGGTGTCGT GGATGCTGGA GCACCCCGCG 
GGGCTGAGCG ACCACGAGGT CGCGCACCAG GCCGCGCTCA TCAACAATTC GAGCCACCAG 
ACCACCACAC ACCTCATCGG TAACACGATG CGCACTCTGT TCACCGACGA GGCGGTCCGC 
GCCGCCTACA CGGACGCGCA GATGACCGTC CACGAACTGC TCGACCACGT GATGTGGACC 
GACACGCCCT TCCAGATCCT GCCCGCCCGG ATCGCCCTCC AGGACATGCG CATCGGCGAC 
GTCGACATCC GCGCGGGCGA CGCCCTGCTG ATCGGCTTCG ACGCCGCCCA TCGCGATCCG 
GCCGTCCACT CCGACCAGGC GGGGGGCAGC AGGGCCCACC TGATGTTCGG CGCCGGGCCG 
CACGCCTGTC CGGCCCGCGA ACTGGCCCGG CTGACCGCCA CGATCGCGGT CACCGCGCTC 
CAGGAGCGCC TGGGCGGGCT CCGGCTCGCC GTGGAGCCGG AGGACCTGCG CTGGGTCCCG 
TCGCCGTTCC TGCGGGGGTT GCGCGAACTC CCGGTGGTCT TCACCCCGGG CGAGCCCCTC 
GCCCTCGGCC CCCGGGAGGG CGCCGGAAGG GGCGGCTCCG GAGGGGACGG GCAGTCGGAG 
GCCGGGGCGC GCGGGGGGGA CCGGGACGAC AGCGACGAGG GCCACGAGGA CGACCTCCTC 
AGCCGTCTGC TCGCCTGGTG GCGCGGACGG AGTTGA

Protein sequence

MSDPASPLRH RTGTPSPRRE GLGSLTTTRL YGTTPATGRD GLWAALRERH GPVAPVELET 
GVRAWLLLGY HENLAVLQNQ HLFSRDTRRW REVVEGRVDL ACARPALSWR PNALYADGAE 
HTRLRSAIAD SLARVDMNAT ARTIRRIADE LIDSFVADGR ADLISEYANP LPVLVVNSLY 
GLSDSYGYML GDLTSIVFSE NAERAEDAVG RIHQYFSELV ARKRRIPGQD LVSWMLEHPA 
GLSDHEVAHQ AALINNSSHQ TTTHLIGNTM RTLFTDEAVR AAYTDAQMTV HELLDHVMWT 
DTPFQILPAR IALQDMRIGD VDIRAGDALL IGFDAAHRDP AVHSDQAGGS RAHLMFGAGP 
HACPARELAR LTATIAVTAL QERLGGLRLA VEPEDLRWVP SPFLRGLREL PVVFTPGEPL 
ALGPREGAGR GGSGGDGQSE AGARGGDRDD SDEGHEDDLL SRLLAWWRGR S