Gene Csal_1015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1015
Symbol
ID	4027861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1145513
End bp	1146616
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	72%
IMG OID	637966192
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_573071
Protein GI	92113143
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGCCGC AACGTGAACT GCTCGACCGC CTCGCCATCG AACTGCCCAT CGTCCAGGCC 
CCCATGGCCG GCGCCAACGA CGCGACACTG GCCATCGCCG CCAGTCGAGG GGGCGCGCTG 
GGCTCGATTC CTTGCGCCAT GCTCGCCCCC GAACGCATCG AGCGGGAGGT CACACGGTTT 
CGCGAGCATG CCACCGGCCC GCTCAACCTC AACTTCTTCT GCCACTTGCC GTCACCGCCC 
GACCCCAACG CCGAAGCCGC CTGGCGCGAA CGCCTGGCAC CGTTCTACCG CGAGGCGGGG 
CTCGACCCCG AGGATGCCGC GCCGGCCGCC CAACGCACGC CCTTCGACGA CGTCCAGTGC 
GTGCTGGTCG AGCGTCTGCG TCCCGAGGTC GTGAGCTTTC ATTTCGGCTT GCCGGACGCG 
CCCTTGCTGG CTCGCGTGAA AGCCACCGGC GCCACGGTCA TGGCCAGTGC CACCACCGTC 
GCCGAGGGGC GCTGGCTGGC CACCAACGGC GCGGACATCA TCATCTCCCA GGGGCTCGAA 
GCCGGCGGGC ACCGCGGCGC GTTTCTCGAG GATACCCGCG CGGACACGGT GGCCGACGCC 
ATGGCCCGCC AGCCCGGCAC CTTCGCGCTG GTACCGCAGC TCGTCGATGC CATCGACCGG 
CCCGTCATCG CCGCCGGGGG CATCGGCGAC GCACGCGGCG TCGCCGCCGC CTTCGCGCTG 
GGTGCCTGCG GCGTGCAGCT CGGCACCTAC TACCTGGCCA CGCCGGAAAG TCTGATCAGC 
GACATTCATC GCGCCGCCCT GGCCGAGGCC CGCGACGACA ACAGCGTCGT CACCCGCCTG 
TTCTCCGGTC GCCCGGCGCG CAGCCTCGTC AATCGAGTGA TTCGCGCACT TGGCCCTCTC 
TCGCCAGCCG CTCCGCCCTT TCCCACCGCC GGTGGCGCGC TTGCCCCGCT CAAGCAAGCC 
GCCGAGGCCC AAGGGCGTGG CGACTTCTCA TCGCTGTGGG CCGGCCAGGC AGCGGCACTG 
GCCCCCCACG GCGACGCCGA GACCCTCACG CGCCGACTGG GCGACGAGAC GCTGGCACGA 
CTCCAGGCGC TGGCTTCGCG TTGA

Protein sequence

MWPQRELLDR LAIELPIVQA PMAGANDATL AIAASRGGAL GSIPCAMLAP ERIEREVTRF 
REHATGPLNL NFFCHLPSPP DPNAEAAWRE RLAPFYREAG LDPEDAAPAA QRTPFDDVQC 
VLVERLRPEV VSFHFGLPDA PLLARVKATG ATVMASATTV AEGRWLATNG ADIIISQGLE 
AGGHRGAFLE DTRADTVADA MARQPGTFAL VPQLVDAIDR PVIAAGGIGD ARGVAAAFAL 
GACGVQLGTY YLATPESLIS DIHRAALAEA RDDNSVVTRL FSGRPARSLV NRVIRALGPL 
SPAAPPFPTA GGALAPLKQA AEAQGRGDFS SLWAGQAAAL APHGDAETLT RRLGDETLAR 
LQALASR