Gene Ndas_2750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2750
Symbol
ID	9246601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3292864
End bp	3294114
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	71%
IMG OID
Product	cytochrome P450
Protein accession	YP_003680669
Protein GI	297561695
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.650686
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTGCC CCGTCCAGCA CACCCCCGAC GGAGTCCCGC TGGTGCACGC CGTGCCCGAC 
GACGTGCAGG CCGACCGCGA ACGCCTCCAC CGGGCCGGAC CCGTCACCCG GGTCGAACTC 
CCCGGCGGGG TCCGCGCCTG GGCCACCACC CACCACGAGG TCAGCCGCGC CACCCTCAAC 
GACCCCCGGT TCGTCAAGAG CGTCGACCAC TGGGACGACT ACCAGAGCGG CCGGGTCCCC 
GAGGGCTGGC CGCTGATGGG CACGATCCCC ACCGACAGCT CCAACATGCT GGCCCAGGAC 
GGCGCCGCCC ACCGGCGCAT GCGCAGACTC ACCGCCAGCC CGTTCTCGGC GCGCCGGGTG 
GAGCGCCTGC GCCCGCGCAT CGAGGAGATC ACCGCCCGGG CGCTGGACGC CCTGGAGCCG 
CGCGCGCACG AACCCCTGGA CCTGAAGTCG GAGTTCACCT TCCGGGTCCC CATGGGGGTG 
ATCGGCGAAC TGTACGGGGT GGCCGAGGCG GAGTACGCCC AGCTCGGCGA GATGTACGCC 
AAGCTCTTCT CCGGCACCAC CGAGGAGGGC GAGCACCTGC GGATCTACGG AGCCCTGTTC 
CAGTTCTTCG CCGAGATGGT CGCCCGCAAG CGCGCCAGCC TGGACGAGCA CGACGACTTC 
ACCGCCGACC TGCTCAGAGC TAGGGAGGAC GGCGACTCCC TCAGCGACAC CGAGGTCACC 
ATCACCCTGC TGACGGTGGT GGCGGCCGGG CACGAGACCA CCGTCAACCT GCTCAACAAC 
GTGGTGCGCG CCCTGCTCGC CCACCCCGAC CAGTTCGCCC TGCTCAAGGC GGGCAAGGTG 
ACGTGGGAGC AGGTCATCGA GGAGACGCTG CGCTACGACC CGCCCAACAA CGTCATGATG 
TTCCGCTTCG CCACCGAGGA CGTGGAGGTC GGCGGGCAGA CCATCCGCAA GGGCGAGGCG 
CTGATGACGC ACTACGGCGC GGCCACCCGC GACCGCGCGG AGTTCGGTGA GGACCCGGAC 
CCGTCCGTCT TCGACCCGCA GCGCACCCAG GGGCGCCACA TCACCTTCGG GTACGGCCCG 
CACATCTGCC CCGGGGCGCC GCTGTCGCGG CTGGAGGCCG GGATCATCCT GCCGATGCTC 
TTCGAGCGCT TCCCGGACCT GCGGCTGGCC GTCCCCGACG AGGAGCTGCG GGTGCAGTCC 
GCGCTCTCGG TCACCAGCCT GAGGGAGTTC CCGGTCGTGC TGCGTCCCTG A

Protein sequence

MPCPVQHTPD GVPLVHAVPD DVQADRERLH RAGPVTRVEL PGGVRAWATT HHEVSRATLN 
DPRFVKSVDH WDDYQSGRVP EGWPLMGTIP TDSSNMLAQD GAAHRRMRRL TASPFSARRV 
ERLRPRIEEI TARALDALEP RAHEPLDLKS EFTFRVPMGV IGELYGVAEA EYAQLGEMYA 
KLFSGTTEEG EHLRIYGALF QFFAEMVARK RASLDEHDDF TADLLRARED GDSLSDTEVT 
ITLLTVVAAG HETTVNLLNN VVRALLAHPD QFALLKAGKV TWEQVIEETL RYDPPNNVMM 
FRFATEDVEV GGQTIRKGEA LMTHYGAATR DRAEFGEDPD PSVFDPQRTQ GRHITFGYGP 
HICPGAPLSR LEAGIILPML FERFPDLRLA VPDEELRVQS ALSVTSLREF PVVLRP