Gene Daro_1349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1349
Symbol
ID	3569239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1465832
End bp	1466932
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	57%
IMG OID	637679817
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_284568
Protein GI	71906981
COG category	[R] General function prediction only
COG ID	[COG4447] Uncharacterized protein related to plant photosystem II stability/assembly factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	5.86783e-22
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.0000013848
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACGGAG TGATTGGGCG CGAGGAGTTG TTGGTCTCGA CTAAGGCCGA AAAGAAGAGA 
CGTGGCCGGG TTTCCAGCCT GATGGTGTCA GGACTTCCCT GGGTGATTAT CGGTGGGTTG 
CTCTGGGCTG GCCTGTTTAT AAAGCCACAG CCGGTTGGGG CAACAGTAAA GCCGCCAATC 
ATGGAGCGCA GGGATCATTA CTACGGCCTT GCCATTGTTC CTGGGCAAGG TCGCTGGCTG 
GCCGGTTCAA GCGGAAAAAT CGTCAGAATC GATGCTGATG GCCATATTGA GAGACTGGCT 
TCGGTGACGG AGCAGACTCT TCAAGATATT GCAGTTTGGG ATGGTGAACA TGGCCTGGCG 
GTTGGCAACG AGGGAGTTGT TCTTCGTACC GCCGATGGTG GCAAAACCTG GCAAGAGGTT 
CGTGATGTGC CGAAATCTCA GGTTGCTAAC AAGCTGAGCC GCGTCCGAGT TGCACCCGGT 
GGGGTCGCCG TGGTGAGTGG AGAGATGGGG GCGTTGCTTG GCACTCAGGA TTTTGGTGAG 
CACTGGAAGC GTTTGCGCCC AGAAGAGGAT CAAGCCTGGA ATGACGTGGC TTTGCTGCCT 
GATGGGCGCC GTGTCGCTGT TGGTGAGTTT GGCAGAATCA CTTTGAGTGA CGATTTCGGC 
GCGACGTGGG TCGATATCAA GACACCCGTT GAGGTGTCGC TGATGTCGGT TTCCTTCGGC 
GATGCCCTGA ATGGCCTAGC AGTCGGTCTT GAGGGAACTG TTCTGATAAC GCGGGATGGC 
GGCAAGAATT GGAAGTCACT CGATGTCGAT CTGCACGATC ACCTCTATGA CATCGCCTGG 
GATGCGGCTG GCAAGCGCTG GATTGGCGCA GGTAATTTGG GGCGCTGGCT CGTGGTGGCG 
GTTGATGGCA AAGCAGAGAC CGGTCGGCTC GACGAGCGGG ATCTTTCGTG GCACGTCCGG 
GCGGTTCCCG AGGGCGATGC AGTCTGGTTC GCTGGTGCGA ATGTTGGGCA ATGGAATGGC 
AAATCATGGA AGCCCTTGGG TGAGTCCTGG CTGCCCAAAA CATTGATCGG ACTTCCTGTC 
ACTTCGGAGA AAAGCAAATG A

Protein sequence

MNGVIGREEL LVSTKAEKKR RGRVSSLMVS GLPWVIIGGL LWAGLFIKPQ PVGATVKPPI 
MERRDHYYGL AIVPGQGRWL AGSSGKIVRI DADGHIERLA SVTEQTLQDI AVWDGEHGLA 
VGNEGVVLRT ADGGKTWQEV RDVPKSQVAN KLSRVRVAPG GVAVVSGEMG ALLGTQDFGE 
HWKRLRPEED QAWNDVALLP DGRRVAVGEF GRITLSDDFG ATWVDIKTPV EVSLMSVSFG 
DALNGLAVGL EGTVLITRDG GKNWKSLDVD LHDHLYDIAW DAAGKRWIGA GNLGRWLVVA 
VDGKAETGRL DERDLSWHVR AVPEGDAVWF AGANVGQWNG KSWKPLGESW LPKTLIGLPV 
TSEKSK