Gene Ndas_4420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4420
Symbol
ID	9248295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5259568
End bp	5260890
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	77%
IMG OID
Product	putative cytochrome P450
Protein accession	YP_003682315
Protein GI	297563341
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.968326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.372865
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCTCTG GATGTCCCCG AGCCGCGCTG CACCGCAACG AGCCGCACCC CGACCCCTAC 
TCCGTGTACG CCGGGATGCG CGCCGACCAC GGGCCCGTGG TCCCGGTCGA GATCGAACCC 
GGCGTGCACG GATGGCTGGT CACCGACTAC GCCACCCTCA TCTCCTGGTC CCGGGACACC 
ACCGCGTTCA GCCACGACTC CAGGTTGTGG CGCGACCTCA GCGAGGGGCG GGTCGGCCCG 
GGCTCCGCGC TGACACCGAT GCTGGCCCCC CGCGCCAGCG CCCTGTACGT GGACGGCGCG 
GAGCACGAGC GCTACCGCGG GGTCCTCACC GACGTCCTCG GCGGCGTCGG CGCCGAACGC 
CTGCGCCGGA CCACCAGCCG CTACGCCGAC CGGCTCATCG ACCAGTTCCG CGCGCGGGGG 
CGGGCCGAAC TCCTCGGCGA GTACGCGCGC GTGCTGCCGC CGCTGGTCAT GAACGACCTC 
CTCGGCCTCG ACGAGGAGCA GGGCACGCGC TTGGCCGCCG CCGTGCGCGA CCTGTGGCTC 
GGCGTGGACG CGCAGAGGTC CGGGGCGGAG GCCGAGCGGG TGCTGTCGGA GGCGGTGGCG 
GCCAGGCGCC GCGAACCCGC CGACGACCTC ACCACGCGGA TGATCCGGCA CCGCGCCGCC 
CTCAGCGACG AGGAGGCGGT CATGCAGCTC CTGCTGGTCG CCGCCGCCAA CGAGCCGACC 
GCGCACCTGA TCGACGCGGT CCTGCGCGCC TGCCTGACCG GACCCTCCGG GCCCGGCGCG 
CCCCCGCCCT CCGACGCCTC CCTGGCCGAG ACCCTCGACC GCGTGCTGTG GCGGGACCCG 
CCGATCACCA ACTTCCCCGT CCTCTACCCG CGTGTGGACG TGCCCCTGGA CGACGGCCGG 
GTGATCGGGG CCGGGTCCCC CGTGCTGATG GCCTTCGCCG CGGCGAACCA CTTCTTCGCC 
CGGGAGAACG CCGAGCGGAT GGAGGAGACC GCCAACCGGG CGCACGTGGC CTGGGGCGCG 
GGGCCGCACC GGTGCCCCGC CATCGAGGAG GCGACCACCG TCGCCGGCGT CGCGGTGCGC 
GTCCTGCTCA CCCGCCTGCC CGGACTGCGC CTGGCCGTCC CGCCCGACCA GCTGCGCTGG 
CGGCTGTCGG CCCTGTCCTG GTCCCCCGTC CGGCTCCCCG TGGAGTTCCC CCCGCAGGAG 
CCCCCGCCCC GCGGGCCCGG GGCGGCGGCG CTCCCGGCCG ACGCGCCCGG GCCCGGTCAT 
CGGGCCCCCG GCGGCCGGTC GTCCCTGCCG AACCTCCTGG CGCGGCTGCT GCGCGGGTCC 
TGA

Protein sequence

MSSGCPRAAL HRNEPHPDPY SVYAGMRADH GPVVPVEIEP GVHGWLVTDY ATLISWSRDT 
TAFSHDSRLW RDLSEGRVGP GSALTPMLAP RASALYVDGA EHERYRGVLT DVLGGVGAER 
LRRTTSRYAD RLIDQFRARG RAELLGEYAR VLPPLVMNDL LGLDEEQGTR LAAAVRDLWL 
GVDAQRSGAE AERVLSEAVA ARRREPADDL TTRMIRHRAA LSDEEAVMQL LLVAAANEPT 
AHLIDAVLRA CLTGPSGPGA PPPSDASLAE TLDRVLWRDP PITNFPVLYP RVDVPLDDGR 
VIGAGSPVLM AFAAANHFFA RENAERMEET ANRAHVAWGA GPHRCPAIEE ATTVAGVAVR 
VLLTRLPGLR LAVPPDQLRW RLSALSWSPV RLPVEFPPQE PPPRGPGAAA LPADAPGPGH 
RAPGGRSSLP NLLARLLRGS