Gene Daro_2881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2881
Symbol
ID	3566286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3100673
End bp	3101776
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	59%
IMG OID	637681350
Product	periplasmic sugar-binding protein, putative
Protein accession	YP_286081
Protein GI	71908494
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	0.333959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGTC TTGCTGGTCT CCTTGCGCTG CTGTTATTTG TTTTCCCAAG TCTGGTCTGG 
GCCATGTCAG TCGCCTTCAT CAATCCGGGA AAGTCGGATG AGGCTTACTG GCTCACTGCG 
ACCAAGGCAA TGGAAGCGGC AGCGAAAGAC CTGGATATAC GCTTCGAAGT CTTTTATGCC 
GAGCGGCAGC ATCCCCGGGT GTTCGAGCTC GCCCGTCAGA TTGTTGCCCG TCCTGTTGCC 
GATCGACCGG ATTACGTGGT GATCACCAAT GATTATGCGA CCGGACCGGA GCTGTTACGG 
CTGTTCGACG CTGCCGGAAT CAAGACTTTT CTGGCCTATA GCGGTATTTC AGAGCCGGTA 
GAGCGGGCTG TGACCGGCCA GCCGCGTGAG CATTTCAAAG GGTGGTTGGG TTCTCTCGAA 
CCGCGGGCCC AGGAGGCAGG TTATCTCACC GCCAAGGCGC TGATCCAGCA GGGGCGTCGG 
GCTCAAGCTC AGGCAGCCGA TGGCCGTTTG CACTTTTTGG CGATCAGTGG CGATCGGTCG 
ACGCCGGCCT CGAATCGGCG GGGCGAGGGA ATGCGCCGGG CGGTGGCCGA GGCGGGCGAT 
GTGGTGCTCG AGCAGGAGAT TTTCTCCGGC TGGAACAGGG CCAAGGCGGC CGAACAGAGT 
GAATGGTTGT TTCAGCGCTA TCCGCTGGCC AGACTGGTCT GGGCGGGAAA TGATCAGATG 
GCCTTTGGCG CAATGCAGGT CTGGGAGAAA CGCGGCGGCA AGCCGGGTAA GGATGCCTGG 
TTCAGTGCAG TGAATGCTTC CCCCGAGGCG ATGGCTGCCC TCAAATCCGG CCGCCTGGCG 
GCACTGGCTG GCGGCCACTT CATTTGCGGC GCCTGGGCGT TGGTCATGCT CTACGACTAC 
GACCATGGCC GGGATTTTGC AGAGGGAGAG GGCGTAGAGG TGAATCAGTC GATGTTCACG 
CTGTTTTCGC AGAAAGATGC GGATCGTTTC ATGGTGCGCT TTGGTCAACT GCACTTCGAT 
CAGGTGAATT TTCGCCGTTT CAGCAAGGCG CTGAATCCGA AGTTGAAACG CTACGATTTC 
AATTTCCGGC AGCTACTGGA CTAA

Protein sequence

MKRLAGLLAL LLFVFPSLVW AMSVAFINPG KSDEAYWLTA TKAMEAAAKD LDIRFEVFYA 
ERQHPRVFEL ARQIVARPVA DRPDYVVITN DYATGPELLR LFDAAGIKTF LAYSGISEPV 
ERAVTGQPRE HFKGWLGSLE PRAQEAGYLT AKALIQQGRR AQAQAADGRL HFLAISGDRS 
TPASNRRGEG MRRAVAEAGD VVLEQEIFSG WNRAKAAEQS EWLFQRYPLA RLVWAGNDQM 
AFGAMQVWEK RGGKPGKDAW FSAVNASPEA MAALKSGRLA ALAGGHFICG AWALVMLYDY 
DHGRDFAEGE GVEVNQSMFT LFSQKDADRF MVRFGQLHFD QVNFRRFSKA LNPKLKRYDF 
NFRQLLD