Gene Daro_3779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3779
Symbol
ID	3567512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4066591
End bp	4067556
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	65%
IMG OID	637682254
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_286978
Protein GI	71909391
COG category	[R] General function prediction only
COG ID	[COG4447] Uncharacterized protein related to plant photosystem II stability/assembly factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.00208447
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000226347
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGGGCGGA TATTTGCCAC CCGACAATTG CCGCTGGGCG TAGCGGTGGC CGGCGCATTG 
CTGTCGGCCT GCACGCAAGC CCCGGACATG TCCGGTATCG CCACCGAGCG TCAGCGCTCG 
GTGCATCGTT ACGACGTCAG CCAGGCCATT GCCAGCAATG ACAAGGTGAT CGTCGTCGGC 
ACCCAGAGCG GTGTCGCGCT GGTTTCGAGC GACAAGGGCG CAAGCTGGCA GCGTCAGGCG 
CTCGGCCAGA CTTCGCTGGT CGATATTGCC GTTTGTGCTG ACAAGACCTT CGTTGCGATC 
GACCATTATC ACAAGGTGTG GTCGGCCGAT GCCGAAGGCA AGAACTGGCA ATCGGCCAAG 
CTCGAGCAGC CGCGCACGCC GCTGGCCGTG ACCTGCAGCC CGCAGGGTGG CTGGTGGGTG 
GCTGGCACCA ATGCCGTGAT CGCCGGCAGT GCCGATCAGG GCAAGACCTG GCAGGTCACC 
GACCTCGGCG AGGACACCCA GATCACCACC ATCCAGTTCG TCAACGACAA GCAGGCGGTG 
GCGCTCGGCG AGTTTGGCCT GACGGTGATG TCCGAGGATG GCGGTGCCAC CTGGAAGAAG 
GGCCCGAAGA TTCCGGGTGA CTTCTATCCC TACGCGGCGC TGTTCCGCGA TGCCCGCGAA 
GGCTGGGTCA GCGGGATTGC CGGCCAGATG CTGCATACCC GCGATGGCGG CCAGACCTGG 
CAGAAACAGG TCAATGCCAC CCAGGCTTCC CTGAACCGCC TGTTCATGCA CGACGGTGGC 
CCGTTTGCTG TCGGCAACGG CGGTGTCATT GCCCGCCTCG AAGGCGACAG CTGGCGCAAT 
GTGCCTTATC CGGATCCGCT GCCGATGTTC CTCGGCGGCG GGGCTTCCCT GCCAGGCCAG 
GCGGCGATCG TCATCGGCGG CCCCGGTGGC CTGCTGCGTG CCGTCGGCAC AGCCAATAAC 
AAATAG

Protein sequence

MGRIFATRQL PLGVAVAGAL LSACTQAPDM SGIATERQRS VHRYDVSQAI ASNDKVIVVG 
TQSGVALVSS DKGASWQRQA LGQTSLVDIA VCADKTFVAI DHYHKVWSAD AEGKNWQSAK 
LEQPRTPLAV TCSPQGGWWV AGTNAVIAGS ADQGKTWQVT DLGEDTQITT IQFVNDKQAV 
ALGEFGLTVM SEDGGATWKK GPKIPGDFYP YAALFRDARE GWVSGIAGQM LHTRDGGQTW 
QKQVNATQAS LNRLFMHDGG PFAVGNGGVI ARLEGDSWRN VPYPDPLPMF LGGGASLPGQ 
AAIVIGGPGG LLRAVGTANN K