Gene Daro_1098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1098
Symbol
ID	3569371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1200966
End bp	1201883
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	69%
IMG OID	637679560
Product	hypothetical protein
Protein accession	YP_284324
Protein GI	71906737
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	0.100036
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.664944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCCT ACCGCCGCTG GCTTCCAGCC ATCGCCCTCG CCGTCCTGTC CCTGACCTGG 
GGCTACACCT GGGTGCTCGC CAAACAGGGC CTGGCCTACG CACCGCCCTT CGCCTTTGCC 
GCTGAACGCT GCGTCGGTGG CGCGCTGTCG CTGCTCGTCG CCCTCAAGCT GACCGGTCGC 
CGGCTGACCC TGGTCGCCCC CTTCCAGACC CTCGGCATCG GCCTGACCCA GGTCGCCGGC 
TTCATGATCT TCCAGACCTG GGCGCTGGTC GAAGGCGGCC CGGGGAAGAC CGCCGTGCTC 
ATCTTCACCA TGCCGATCTG GACCCTGCTC CTCGCCTGGC CGCTGCTCGG CGAGCGGGTG 
CGTGGCAAGC AGTGGCTGGC GGCGGCCAGC ACGCTGACCG GCCTGCTGCT GATCATCGAA 
CCGTGGGACA TGCACGCCAG CCTGTTCAGC AAATTCCTCG GCCTGATGGC CGCCCTGTGC 
TGGGCCAGCG GCACCATCCT GATCAAGCGC CTGCGCGCCG TGACGCCGGT GGACCTGCTG 
ACCCTGACCG CCTGGCAGAT GATCCTCGGC GCCGTGCCGC TGGTCCTGCT CGCCCTCGTC 
GTGCCCGAAC CGGCCACCCA CTGGACGCCC GCCTACGTCG GCCTCCTGCT CTTCATGTCG 
GTGGCCAGCA CGGCGATGTG CTGGTGGCTG TGGATCTATA TCCTCGACCG CGTGCCAGCC 
TGGGAAGCCA GCCTGTCGGT GCTCGGCACG CCGGTCGTCG CCATCCTGTC GTCGCGCCTC 
ACGTTCGGCG AATCGTTCAA GGGCACCGAG ATCGCCGGCA TCCTGCTCAT CGGCGGCGGC 
CTCGCCCTGC TCTCGCTGCT TGGCTGGGCG GCCAGCCGGC GCAATCCGGC GCTCACCCAC 
CCCAAGGAAC GCACATGA

Protein sequence

MNSYRRWLPA IALAVLSLTW GYTWVLAKQG LAYAPPFAFA AERCVGGALS LLVALKLTGR 
RLTLVAPFQT LGIGLTQVAG FMIFQTWALV EGGPGKTAVL IFTMPIWTLL LAWPLLGERV 
RGKQWLAAAS TLTGLLLIIE PWDMHASLFS KFLGLMAALC WASGTILIKR LRAVTPVDLL 
TLTAWQMILG AVPLVLLALV VPEPATHWTP AYVGLLLFMS VASTAMCWWL WIYILDRVPA 
WEASLSVLGT PVVAILSSRL TFGESFKGTE IAGILLIGGG LALLSLLGWA ASRRNPALTH 
PKERT