Gene Daro_0358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0358
Symbol
ID	3569831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	390481
End bp	391683
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	64%
IMG OID	637678800
Product	hypothetical protein
Protein accession	YP_283587
Protein GI	71906000
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	0.23836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000671481
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAACTCAC AGAGAGAACG CCTCAAGGTG CTGAGCGCCG GGATATTCAG CCTGCTGCTG 
ACCTTTGGCG TGGCCCGCTT TGCCTACACG CCCTTGCTGC CGATCATGCA GCAGCAGGCC 
GGGCTGGGGC TGGCCGAAGC CGGCTGGCTG GCGGCGCTCA ACTACGCCGG TTATCTCAGT 
GGCGCACTGA TTGCCTCGCT GATCAGCAAC CTGGTGCTCA AGGACAAGCT GTACCGGATC 
GGCCTGGTGG TCGCCATCCT GAGCACGGTG ATGATGGGGC TGACCACCGA CCCGCTGCTC 
TGGATGGCCT CGCGCTTCAT CGCCGGCCTC TCCAGCGCGG CCGGCATGCT GCTCGGCACC 
GGGCTGATCC TCAACTGGCT GATTCGCCAC AACCACCGGC CGGAGTTGGG CATCCACTTT 
GCCGGCATCG GGCTGGGCAT TTCCGGTTGT GCCGTGGCGG TGTGGCTGAT GGGCGGCTGG 
CTGGACTGGC GCGAGCAGTG GTTCGCCTTT TCGGCCATTG CTTGTCTGCT CATTGTGCCG 
GCCATGGCCT GGTTGCCGGC GCCCGATACC AGTCCGGTGA CGAAGAGCGG CGTCACCATG 
CACGACAATC CGCCGAGCCC GCTGTTCCTG CGCATCTTCA TGGCAGCCTA CTTCTGTGCC 
GGTTTCGGCT ATGTGATCAG TGCCACCTTC ATCGTCGCCA TCGTCAATGG CCTGCCTGGT 
CTGGCCGGGC AAGGCGGGCT GGCCTTCCTG GCCATCGGTC TGGCCGCTGC GCCCGCCGCC 
TTCAACTGGG ATCTGATCGC CCGCTACACG GGGGACATCA ATGCCCTGAT ACTCGCCGCC 
GTGCTGCAGA TATTCGGCAT TGTCCTGCCG GTGGCGGTCG GTGGGCTGAT TCCGACGATC 
TTTGGTGCGT TGTTGTTCGG TGGAACCTTC ATCGGCATGG TGAGTCTGGT CTTGACCATG 
GCCGGGCGCT ACTACCCGAC CAAGCCGGCC AAGATGATGG GCAAGATGAC GCTCTCCTAC 
GGCGTGGCGC AGATCATCGG GCCGGCCATC GTTGGCTGGC TGGCCACCCG GCTCGGTAAC 
TATTCGATTG GCCTGTATAT CGCGGCCGGC GTGATGGTGA TGGGCGTCGT GCTGTTGGTT 
ATACTGAAAC TGGTGGAAAA GCGGGACGCC ACGCTGGCGC TTGAGCCCAG CTTGCAGAAC 
TGA

Protein sequence

MNSQRERLKV LSAGIFSLLL TFGVARFAYT PLLPIMQQQA GLGLAEAGWL AALNYAGYLS 
GALIASLISN LVLKDKLYRI GLVVAILSTV MMGLTTDPLL WMASRFIAGL SSAAGMLLGT 
GLILNWLIRH NHRPELGIHF AGIGLGISGC AVAVWLMGGW LDWREQWFAF SAIACLLIVP 
AMAWLPAPDT SPVTKSGVTM HDNPPSPLFL RIFMAAYFCA GFGYVISATF IVAIVNGLPG 
LAGQGGLAFL AIGLAAAPAA FNWDLIARYT GDINALILAA VLQIFGIVLP VAVGGLIPTI 
FGALLFGGTF IGMVSLVLTM AGRYYPTKPA KMMGKMTLSY GVAQIIGPAI VGWLATRLGN 
YSIGLYIAAG VMVMGVVLLV ILKLVEKRDA TLALEPSLQN