Gene Daro_4091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4091
Symbol
ID	3566855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4387542
End bp	4388750
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	637682563
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_287287
Protein GI	71909700
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	71
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAAAGA CTTCGGCACG CGCTAGCGTC TTGCTGGCCG CACTGCTGCT CGCCGGCACG 
GCGGCCGCCC ATGACCATGC CGACCACTCG GCCCACGACG CCAAGCCCAA AGCCGACTAC 
GCCAAGGTCT GGCTGGAAAA ACAACAGACG GCGCCCCGCC TTGCCATTGC CGCGCAATTC 
GACGCAACTG GCCAACTCTG GCTGGCCCGC GTGATCGGCC AACAGATTTT CGTCAGCCAT 
TCCAGGGATG CCGGCAAGAC CTTCAGCGAT GCGGTGACGG TCAACCGCCA GCCCGAGCTG 
ATCTCGGCCG ATGGCGAAGC CCGCCCGCAG ATCGCTGTTG CCGGGCAGCG GGTTTATCTC 
AGCTGGACGC AGGCGTTGCC GCAACCGTTT GCCGGGCACG TCCGCTTCTC GGTGTCCGAA 
GATGGCGGCC AGACGTTTAG CGAACCCGTC ACCGTCAATG ACGACAGCCG CCCGATCACG 
CATCGCTTCA ACGCCATGCT GGCCGATGCC GGCGGCGTGA CGCTGGCCTG GATCGACAAG 
CGGGACGGCA CCGGCAACTC GGACTATCGC GGTGCGGCCA TCTACACCGC CCGCTCGACC 
GATGGTGGGC GCAGCTTCTT AACCAACCGC AAGCTGGCCG ACAACTCCTG CGAATGCTGC 
CGCCTGGGCC TGGCCGCTGA CAGCGACGGC ACCCCGGTCG TTTTCTGGCG CCAGATTTTC 
GGCAAGAACG TCCGCGACTT CGCGCTGGCC CGCCTCGATG AACCGCTACG CCGCGTTTCT 
GAAGATGGCT GGGAAATCGA TGCCTGTCCG CACCATGGCG GCGCACTGGC TATCGACAAC 
GAAGGCAGTC GCCACATCGC CTGGTTTACC GGCGCCGAAA AATCGCCCGG CCTGCACTAT 
CGCCGCATCG ACGGCGAGAC GATGAGCCGT CCGTTCCACT TCGGCAACCT TGATGCCCAG 
TCCGGACACC CGCAAGTGGC GGTTGTCGGG CGCAAGGTCG TACTCGTCTG GCGGGAATTC 
GACGGCAAGT TCAATCACAT CCGCCTGATG ACCTCGCGCG ACCGGGGCCA GACCTGGTCG 
GCCCCGACCA GTCTGGCCCG CACCGCCGGT GCCGCCGACG ATCCATTGCT GCTCACCGAC 
CGTGGTATCC CCTGGCTGGT CTGGAATACC ACGGAGGATG GTTTGAAACG CTCGCGGATT 
GCGCCATGA

Protein sequence

MVKTSARASV LLAALLLAGT AAAHDHADHS AHDAKPKADY AKVWLEKQQT APRLAIAAQF 
DATGQLWLAR VIGQQIFVSH SRDAGKTFSD AVTVNRQPEL ISADGEARPQ IAVAGQRVYL 
SWTQALPQPF AGHVRFSVSE DGGQTFSEPV TVNDDSRPIT HRFNAMLADA GGVTLAWIDK 
RDGTGNSDYR GAAIYTARST DGGRSFLTNR KLADNSCECC RLGLAADSDG TPVVFWRQIF 
GKNVRDFALA RLDEPLRRVS EDGWEIDACP HHGGALAIDN EGSRHIAWFT GAEKSPGLHY 
RRIDGETMSR PFHFGNLDAQ SGHPQVAVVG RKVVLVWREF DGKFNHIRLM TSRDRGQTWS 
APTSLARTAG AADDPLLLTD RGIPWLVWNT TEDGLKRSRI AP