Gene Ndas_2239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2239
Symbol
ID	9246089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2679132
End bp	2680451
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	76%
IMG OID
Product	putative phytochrome sensor protein
Protein accession	YP_003680167
Protein GI	297561193
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0494571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.300779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTTC CGCCGCTGGA CACGGCCCTG CCGGCCGGGG CCGACGCCCG CGAGCACGCC 
CGCCTGCTCC GGCGCGTGCA CGAGGCCTCG CTCTCCGGGC GCCCGGCGCC GGCCGCCCTG 
CGGCCGGTCA TCGAGGACTC CTGGTCCCGC AGCCGACGCT TCGGGATCGA CCCCGACAGC 
GCCCCGCCGC CCCGCATGGC CCGGCTGGAC GAACTCCAAC GGCACCGGGA CGCCTCCCCG 
ATCGCCGAGG TCCTGCCGCT GATCCGCCGC TCCCTCGTCT CGGTCGCCGA CGAGGCCGAC 
CACATCATGC TGGTCACCGA CGCCTCCGGT CAGGTCCTGT GGCGCGACGG CTCCCACCGC 
GTCCGCGCCC TCGGCGACCG CGTCGGGCTC GTCGAGGGGG CCTTCTGGAA CGAGGGCAGC 
ACCGGCACCA ACGCCATCGG CACCGCCCTG GTCGTGGGGC GGCCCGTGCA GGTCTACTCC 
GCCGAGCACT TCATGCGCAG CCTGCACGCC CTCACCTGCG CCTGCGCACC CATCCACGAC 
CCCCGCGACG GCCGCCTGCT CGGCGCCGTC GACGTCACCG GCCCCGTCTC CACCATCCAC 
CCCTCCACCC TCGCCCTGGT CAGCGCGGTG GCCCAACTGG CCGAAGCCCA TCTGCAGAGC 
CTCCACCACA CCCACCTGGA GCGGCTGCGC TCGGTGGCCG CGCCCCTGCT GGCCGGGATG 
AGCGAACGCG CGCTGGTGGT GGACGAGGCC GGGTGGACCG CCGCCGCCGT CCACATGGAG 
CCGGTCCGCA GGGTGCTGCT GCCCAAACAG CGCGGGAGCG GCACCGCCTG GCTGCCCGCC 
CTGGGGGAGT GCGCCCTGGA GCCCCTGCCC GGCGGATGGC TGCTGCGCCC GCGTCCGGCG 
GCGGAGAGCG CGCCCTCCAC GGTCACCCTG GACCTGACCC GGCCCTCGCC CAGGATGGTG 
GTCGCCGGGC CCAGCGGGGA GTGGGCGCAC CGGCTCACCC CGCGCCACGC GGAGCTGCTG 
CTGCTGTTGG CCGTGCACCG GGCCGGGCGC ACCGGAGCGC AGCTGTCCCA GGACGTGTTC 
GGCGCGGGCG GGCACGTGGT GACGGTGCGC GCCGAGCTCT CGCGCGTGCG CCGCCACCTG 
GGCGGCATCA TCCAGAGCCG CCCCTACCGG TTCAGCGGGG AGGTGCGGGT GCGGGTGGTG 
CGTCCCCCCT CACCGGTGGA CCTGCTGCCC GGGTCGGTGG CCCCCGGGGT GTGCGCGCTG 
CGGGACGCGC TCCGCGACGG CGACTGTCCC ATGGCTCTGC GCGACGGAAC CGCAACCTAG

Protein sequence

MSFPPLDTAL PAGADAREHA RLLRRVHEAS LSGRPAPAAL RPVIEDSWSR SRRFGIDPDS 
APPPRMARLD ELQRHRDASP IAEVLPLIRR SLVSVADEAD HIMLVTDASG QVLWRDGSHR 
VRALGDRVGL VEGAFWNEGS TGTNAIGTAL VVGRPVQVYS AEHFMRSLHA LTCACAPIHD 
PRDGRLLGAV DVTGPVSTIH PSTLALVSAV AQLAEAHLQS LHHTHLERLR SVAAPLLAGM 
SERALVVDEA GWTAAAVHME PVRRVLLPKQ RGSGTAWLPA LGECALEPLP GGWLLRPRPA 
AESAPSTVTL DLTRPSPRMV VAGPSGEWAH RLTPRHAELL LLLAVHRAGR TGAQLSQDVF 
GAGGHVVTVR AELSRVRRHL GGIIQSRPYR FSGEVRVRVV RPPSPVDLLP GSVAPGVCAL 
RDALRDGDCP MALRDGTAT