Gene Daro_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1054
Symbol
ID	3568217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1156049
End bp	1157095
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	61%
IMG OID	637679516
Product	selenophosphate synthetase
Protein accession	YP_284280
Protein GI	71906693
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGAAG AAAAAATCAG ACTTACCCAG CTTTCCCATG GTGGTGGCTG TGGTTGCAAG 
ATCGCGCCTG CCGTATTGCA GAAAATTCTG GCCGGCACCA CGGGCAGCAT CATTCCGCCG 
CAGCTACTGG TCGGTACCGA GACCAGCGAC GACGCTGCGG TCTACCAGAT CAACGCGCAG 
CAGGCGATTG TCGCGACGAC CGACTTTTTC ATGCCGATCG TCGACAATCC TCGCGATTTC 
GGGCGCATCG CGGCGACCAA TGCCATTTCG GATGTTTATG CCATGGGCGG GACGCCGTTG 
TTCGCGCTGG CGCTAGTCGG CATGCCGGTC AATGTCCTGC CGCTGGAAAC CATCGGCCAG 
ATTCTGCAAG GCGGTGAGGA CGTCTGCCGG GCAGCCGGCA TTCCCATTGC CGGCGGCCAT 
ACGATCGATT CGGTTGAGCC CATCTATGGC CTGGTGGCCA TCGGCTTGGT CAACCCGGAA 
CATTTGAAGC GCAATTCCGG CGCCAAATCC GGGGACAAGC TGATCCTTGG CAAGCAACTC 
GGTGTGGGGA TCTACAGCGC GGCGCTGAAA AAGGATCAAC TCCAGGCCAA GGATTACGAA 
GCCATGGTCG AGACCACAAC CCAGCTCAAT ACGCCGGGGC CGGTATTGGC CTGTCTGGAT 
GGTGTTCATG CCGTGACCGA CGTCACCGGC TTCGGGCTGG CCGGTCATCT GCTGGAAGTC 
TGCAAGGGCA GCGGCCTGCG GGCGACAGTG AATTACCAGG ATTTGCCGGT ATTGCCCAAA 
GCTCGCGAGT TCATGCAGGC CGGACTGATG ACCGGCGCTT CGGGACGCAA CTGGGCGAGC 
TACGGCGAAG GTGTGCGTAT CGCCGACGGC CTCGAAGGCA TCGCGCAGAC CTTGCTGACT 
GACCCCCAGA CATCCGGTGG TTTGCTGGTT TCATGCTCGC CGGAAACGGT GACGGAAGTG 
CTCTCCTTGT TCCTGCAGCA CGGCTTCCCC CACGTTTCGG TGATCGGCGA AATGGCCGAA 
GGCGAACCGG GCATCGACGT CATTTAA

Protein sequence

MPEEKIRLTQ LSHGGGCGCK IAPAVLQKIL AGTTGSIIPP QLLVGTETSD DAAVYQINAQ 
QAIVATTDFF MPIVDNPRDF GRIAATNAIS DVYAMGGTPL FALALVGMPV NVLPLETIGQ 
ILQGGEDVCR AAGIPIAGGH TIDSVEPIYG LVAIGLVNPE HLKRNSGAKS GDKLILGKQL 
GVGIYSAALK KDQLQAKDYE AMVETTTQLN TPGPVLACLD GVHAVTDVTG FGLAGHLLEV 
CKGSGLRATV NYQDLPVLPK AREFMQAGLM TGASGRNWAS YGEGVRIADG LEGIAQTLLT 
DPQTSGGLLV SCSPETVTEV LSLFLQHGFP HVSVIGEMAE GEPGIDVI