Gene Ndas_3490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3490
Symbol
ID	9247359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4182414
End bp	4183634
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	74%
IMG OID
Product	cytochrome P450
Protein accession	YP_003681397
Protein GI	297562423
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGCCG ACGGGACCGA ATCGCTGATG GACTACCCCT TCCCCGGCCC GGAGGCGCTG 
GAGCCGCCCG CCGAGTGGGC CGAGCTGAGG CGGCGGTGCC CCGTCGCCGG GGTACGGCTG 
CCCAGCGGCG ACCGGGCGGA GGTGGTCACC CGCTACGAGG ACGTCAGGCG GGTGCTCTCC 
GACCCGCGCT TCACCCGGCG GCTCGACGCC GAGGACGCGG CCCGGGTCTC GGCCAGCGCG 
ACGGGCGGCG TGTTCAACAG CGACCTGGCG GCGGCGGTCC CCGACAGCGG GGAGGAGCAC 
CGGCAGTGGC GGCGGCTGGT CGGCAAGTGG TTCACCGCCA GGCGCATGAA CGCGCTGCGG 
CCCGGCATCG AGGCCATGGC CGACCAGCTC GTCGACGGCA TGGTCGAGCG CGGCCACCCG 
GCCGACCTCA GGGCGGACCT GGGCTTCCCC CTGCCGGTGT GGGTCATCTG CGACATGCTC 
GGTGTGCCCG ACTCCGACCG CGACCGCTTC TCCCACTGGT CGGACGCGCT GCTCAATCTC 
ACCCGCTACA CCCAGGAGGA GATGGACCGG GCCCAGGCCG AGTTCCTCGC GTACATGGGC 
GGCCACGTCG AGGCCAAGCG GGCGGAGCCG CGCGAGGACC TGATCAGCTC CCTGATCACC 
GAGACCGCCG AGGCCGGGTA CGACCTGCCC ACCTCCGCGC TGGTCGCCAC CAGCATGGGC 
CTGCTGGTCG CCGGGCACGA GACCACCGCC AACATGATCG GCAAGATGGT GGCGATGCTG 
CTGGACGACC GGAGCCGCTG GGAGAGGCTG CTGGCCGACC GGACGCTGGT GCGCTCCGCC 
GTGGAGGAGG CGCTGCGCTT CGACGCCAAC TCCGGGCTCG GCCTGCCGCG CTACATCACC 
GAGGAGACCG AGATCGGCGG CGCCACCGTC CCCGCCGGGA CCACCGTCAT GTGCAGCATG 
GGCGCCGCCA ACAGGGACGA GAGCGCGTTC GAGAACGCGG ACGAGATGGA CCTGGGGCGC 
GTGCCCAACC CGCACCTGGG CTTCGGCGCC GGGGCGCACT CGTGCCTGGG GCAGGCGCTG 
GCCCGCACCG AACTCCAGGC CGTGCTCGAC GTGCTGCTGC GCAGACTCCC CACGCTGGAG 
CTGGCCGTCC CCGCGGCGGA GCTGCGGCGA CTCGACGGCC TGGTCGTGGG CGGACTGCGC 
GAGGTCCCGG TCCGGTGGTG A

Protein sequence

MGADGTESLM DYPFPGPEAL EPPAEWAELR RRCPVAGVRL PSGDRAEVVT RYEDVRRVLS 
DPRFTRRLDA EDAARVSASA TGGVFNSDLA AAVPDSGEEH RQWRRLVGKW FTARRMNALR 
PGIEAMADQL VDGMVERGHP ADLRADLGFP LPVWVICDML GVPDSDRDRF SHWSDALLNL 
TRYTQEEMDR AQAEFLAYMG GHVEAKRAEP REDLISSLIT ETAEAGYDLP TSALVATSMG 
LLVAGHETTA NMIGKMVAML LDDRSRWERL LADRTLVRSA VEEALRFDAN SGLGLPRYIT 
EETEIGGATV PAGTTVMCSM GAANRDESAF ENADEMDLGR VPNPHLGFGA GAHSCLGQAL 
ARTELQAVLD VLLRRLPTLE LAVPAAELRR LDGLVVGGLR EVPVRW