Gene Daro_0557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0557
Symbol
ID	3568882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	617654
End bp	618781
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	68%
IMG OID	637679000
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_283784
Protein GI	71906197
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4692] Predicted neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	63
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.560584
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCCT TGTCGCCAGC AGTGATCCAC CATGGCAGCG CCGGGCTGTT TCTTGCTGCA 
CTGGCAGCCG CCTTCCTGCG CCTGCCAGCC ACCGAAGCAC CGGCCTTTGT GCCGCCCCCC 
GTCGTCGCCA GCCCGCTGCC GGCCGACATG ACACGAAGCA ACCTGCCTTC AGCCGGTGCC 
ACGGCCGGAC CGGCAAGCCT GACCCTGCTG GCCGACGGCA AGGTAGCCGC GGCCTGGCTG 
GCCGGACCGG GTAACGATAA CTCGGCGGCG ACGATCTGGT TGTCGATCCT CGGTCGCAGC 
GGCTGGAGCC AACCCTTGCC AGCCGCCACC CGCGAAAGTA CGGCCGCCGG CACTTTTGCC 
CACATGAGCA GCCTGGGACG CCCGCTTTTG CTGGCCGAAG GCAGCTGGCT ACACCTCTGG 
TACGAAAGCC TGCCGCTCGG CAGCGGGGCA GGGGCGGCCA TTGTCCATAG CCTTTCCACG 
GATGGCGGCA AGACGTGGAG CAAAGCGGAA CGACTGCAAA CCTCGCCGCT CGGCACACTG 
GGCAACGGAC TGGGCGGACC GCCTCTGATG CTTGCTGACG GCGGCCTTGG CCTGCCGCTC 
GACCAGCGAT TTCCGAAGCA AGGCAGCGAG TGGCTGCGCC TGTCGGCGAC CGGCCGGATA 
GTGGACAAGA GACGGCTGGC CCACGCGGCA CCAACGCTGC AACCGGCGGT TGTCGCCCTC 
GACGACCACA GGGGGCTGGC GGTGCTCCGC GACAACCGCG CCGGCACCAG CCGAGCCACG 
CTCAGCACGA CCAACGGCGG CCAGACATGG GAAACGGCCA GCGAACTCGC CCTGCCCGCC 
CCGGACGCAC CTGTTGCGCT GCTCCGCCTG GCCAGCGGCC GCCTGCTGCT GGCCGGCAAC 
CCGCAACAGG GCAAGGAAGC GCTGCAGCTG TGGCTCTCGG CCGACGATGG GCAAACCTGG 
GCGATGAAAC GCATCGTCGA AGCGGCCAGC GATGGCGGGG CCGAATTCGC TGATCCGGCC 
TTGCTGCAGG GGCGCGATGG CCGCATTCAT CTGACCTACA CCTGGCGCCA GCAGCAGATC 
AGGTATGTCG CATTTACCGA AGCATGGCTG GCGGGAGGCG CACCATGA

Protein sequence

MQPLSPAVIH HGSAGLFLAA LAAAFLRLPA TEAPAFVPPP VVASPLPADM TRSNLPSAGA 
TAGPASLTLL ADGKVAAAWL AGPGNDNSAA TIWLSILGRS GWSQPLPAAT RESTAAGTFA 
HMSSLGRPLL LAEGSWLHLW YESLPLGSGA GAAIVHSLST DGGKTWSKAE RLQTSPLGTL 
GNGLGGPPLM LADGGLGLPL DQRFPKQGSE WLRLSATGRI VDKRRLAHAA PTLQPAVVAL 
DDHRGLAVLR DNRAGTSRAT LSTTNGGQTW ETASELALPA PDAPVALLRL ASGRLLLAGN 
PQQGKEALQL WLSADDGQTW AMKRIVEAAS DGGAEFADPA LLQGRDGRIH LTYTWRQQQI 
RYVAFTEAWL AGGAP