Gene Daro_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1950
Symbol
ID	3567879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2102758
End bp	2103975
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	57%
IMG OID	637680421
Product	cysteine desulfurase IscS
Protein accession	YP_285166
Protein GI	71907579
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR02006] cysteine desulfurase IscS [TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00000000843977
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.404205
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGA AACTCCCCAT CTACCTGGAT TACTCGGCAA CCACCCCGGT CGACCCCCGT 
GTCGCCGAAA AAATGATTCC CTACCTCTGC GAGCATTTCG GCAATCCGGC GTCGCGTTCG 
CACAGCTTTG GCTGGGTCGC CGATGCGGCG GTCGAAGAGG CCCGTGAGCA GGTTGCTGCG 
CTGGTCAATG CAGATCCCAA GGAAATCGTC TGGACCTCCG GTGCGACCGA ATCCAACAAC 
CTTGCCATCA AGGGCGCGGC CAATTTCTAT GCCAGCACCA AGGGCAAGCA CATCATCACG 
GTCAAGACCG AGCACAAGGC CATTCTCGAT ACCGTGCGTG AAATGGAGCG CCAGGGTTTC 
GAGGCGACTT ATCTTGACGT CAAGGAAGAC GGTCTGCTTG ATCTGGAAGT CTTCAAGGCG 
GCCATTCGTC CGGATACCGT GCTCGCCTCG GTGATGTTCG TCAATAACGA AGTCGGTGTC 
ATTCAGCCGA TCGCCGAACT CGGTGAAATC TGCCGCGAGA AGGGCATCAT CTTTCACGTC 
GATGCTGCAC AGGCCACCGG CAAGGTCGAT ATCGATCTGA GCAAGCTGAA GGTCGATCTG 
ATGAGCTTCT GCGCCCACAA GACCTATGGT CCGAAGGGTA TCGGCGCGCT GTACGTCCGC 
CGCAAGCCGC GTATCCGTCT CGAAGCCCAG ATGCACGGCG GCGGTCATGA GCGCGGTTTC 
CGCTCCGGCA CCTTGCCGAC CCATCAGATC GTCGGCATGG GCGAGTGCTT CCGTTTGGCC 
AAGGAAGAAA TGGCTGAAGA GAACAAGCGC GTTGGTGCTC TGCGCGACAA ATTGCTGAAG 
GGCTTGCAGG ATATCGAGGC CACTTTCGTC AATGGTGACC TGACGCAACG CGTGGCGCAC 
AATCTCAACA TCAGCTTTGC CTATGTTGAG GGTGAGTCGA TGATCATGGC GATCAAGGAT 
CTGGCGGTTT CGTCCGGTTC GGCCTGCACC TCGGCCAGCC TGGAACCTTC CTACGTGCTA 
CGTGCCCTGG GGCGTGATGA TGAACTGGCT CACAGTTCCA TCCGTTTCAG CATCGGTCGC 
TTTACGACAG AAGAAGAAAT TGACTATGCA ATCAAATTGT TGCATCAGAA AGTTGGTAAG 
TTGCGCGAAC TTTCACCGCT GTGGGAGATG TACAAGGATG GCATCGATCT GAGCACCGTT 
CAGTGGGCAG CGCACTAA

Protein sequence

MTMKLPIYLD YSATTPVDPR VAEKMIPYLC EHFGNPASRS HSFGWVADAA VEEAREQVAA 
LVNADPKEIV WTSGATESNN LAIKGAANFY ASTKGKHIIT VKTEHKAILD TVREMERQGF 
EATYLDVKED GLLDLEVFKA AIRPDTVLAS VMFVNNEVGV IQPIAELGEI CREKGIIFHV 
DAAQATGKVD IDLSKLKVDL MSFCAHKTYG PKGIGALYVR RKPRIRLEAQ MHGGGHERGF 
RSGTLPTHQI VGMGECFRLA KEEMAEENKR VGALRDKLLK GLQDIEATFV NGDLTQRVAH 
NLNISFAYVE GESMIMAIKD LAVSSGSACT SASLEPSYVL RALGRDDELA HSSIRFSIGR 
FTTEEEIDYA IKLLHQKVGK LRELSPLWEM YKDGIDLSTV QWAAH