Gene Ndas_4942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4942
Symbol
ID	9248829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	79439
End bp	80749
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	71%
IMG OID
Product	cytochrome P450
Protein accession	YP_003682831
Protein GI	297563858
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGC GCACCCCCCG CTCGGCCGTC GCGGTCACCG GACTGCGCCG GACACACACC 
ACCGCCAGAC GAGGAACGGC CATGAGCGAC CCCCTCCACA CCGTCACGGC GCTGCCCGAG 
GCGCGTCGGC CCGGCTGCCC CTTCGATCCG CCCGAGGAAC TGCTCCGGGC GCGCGAGCAC 
GGCCCCATCA GCCGCTACGC CTTCCCCGAC GGCCACCAGG GCTGGCTGGT CACCGGATAC 
GACCTGGTCC GGTCGGTCCT GGCCGACCCG CGCTTCAGCT CCCGCAAGGA GCTCATGCGC 
CACCACCCGC TGATCGACTA CGGCGACATC GAGGTCCCTC CGGCGCCGCC CGGCGAGTTC 
CTCCTCATGG ACGAGCCGCA GCACGGGCGC TACAGGAAAC CGCTGGTGGG CAGGTTCACC 
GCGCGGCGGA TGCGGCTGCT CACCGAGCGC GTCGAGGAGA TCACGGCCGA GCACCTGGAC 
GCCATGGAGG CGGCCGGGCC GACGGCGGAC CTGGTGACCG CGTTCGCCAA GCCCGTCCCC 
ACCATGGTGA TCTGTGAGCT GCTGGGGGTG CCGTACGAGG ACCGGCGCTC CTTCCAGGAG 
AACATCGACA AGTTCATGAG CGGGGAGACG AGCGACGAGG ACCTGACAGC GGCCTACACC 
GCGACCCAGC GCTACCTCGC GGAACTGGTG GCCGCCAAGC GCGCGAACCC CACCGACGAC 
GTGCTCAGCG ACCTCACCGA CAGCGACCTG ACCGACGAGG AGCTGAAGGG GATCAGCCTG 
GTCCTGCTGG CGGCCGGGTT CGACACCACA GCGAACACCC TGGCGCTGGG CGCCTTCGCA 
CTGCTGCGCG ATCCGGCGCA GCTGGCCGCG CTGCGGGACG AACCCGCGCT CGCCGACCGT 
GCCGTGGAGG AGCTGCTGCG GTACCTGAGC GTGGCCAAGA CGTTCATGAG GACGGCGCTG 
GAGGACGTCG AGCTGGGCGG CCGGACCGTC GAGGCCGGTA CGACGGTCAT CGTGTCGCTC 
AACACCGCCA ACCGCGATCC CGAGCGCTTC ACCGATCCCC ACGTCCTCGA CGTCGGCAGG 
CGCGAGGGCG GGCACCTGGC CTTCGGCCAC GGCATCCACC AGTGCCTGGG GCAGCAGCTG 
GCCCGCGTCG AGATGCGGGT CGCGCTGCCC GCGCTGTTCG ACCGCTTCCC CACGCTGCGC 
CTGGCCGTGC CGGCCGAGGA GGTCGAGGCC GGACTGCGTC CGGAGACCGC GGACCTGCAC 
GGGCTGAAGA GCCTCCCGGT CACCTGGGAC GTGTCTACGG TGACGGCGTG A

Protein sequence

MNQRTPRSAV AVTGLRRTHT TARRGTAMSD PLHTVTALPE ARRPGCPFDP PEELLRAREH 
GPISRYAFPD GHQGWLVTGY DLVRSVLADP RFSSRKELMR HHPLIDYGDI EVPPAPPGEF 
LLMDEPQHGR YRKPLVGRFT ARRMRLLTER VEEITAEHLD AMEAAGPTAD LVTAFAKPVP 
TMVICELLGV PYEDRRSFQE NIDKFMSGET SDEDLTAAYT ATQRYLAELV AAKRANPTDD 
VLSDLTDSDL TDEELKGISL VLLAAGFDTT ANTLALGAFA LLRDPAQLAA LRDEPALADR 
AVEELLRYLS VAKTFMRTAL EDVELGGRTV EAGTTVIVSL NTANRDPERF TDPHVLDVGR 
REGGHLAFGH GIHQCLGQQL ARVEMRVALP ALFDRFPTLR LAVPAEEVEA GLRPETADLH 
GLKSLPVTWD VSTVTA