Gene Daro_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1389
Symbol
ID	3566117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1519188
End bp	1520117
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	64%
IMG OID	637679857
Product	hypothetical protein
Protein accession	YP_284608
Protein GI	71907021
COG category	[P] Inorganic ion transport and metabolism [S] Function unknown
COG ID	[COG0586] Uncharacterized membrane-associated protein [COG0607] Rhodanese-related sulfurtransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0000000831518
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.286755
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATTT CCCAGCTTGG CGAAGCGCTC CAGCGTGATG CAGTCTGGGT CGTTTTCCTG 
AACGTCCTGC TGCAACAGAT CGGGCTACCG GTGCCAGCCG TTCCCACCCT GCTCCTGGCC 
GGCAGCCTGA TCGTCGGCTC CTGGCAGTTT GCCAGCGTCT TGGCCGCCGC CATCGTCGCG 
TCGGTGCTGG CCGACTGGGT CTGGTACCTG GCTGGGCGCG CCTTTGGCTA TCGCGTGCTG 
GCCGGCCTAT GCAAACTGTC GATCAATCCC GGCTCCTGCG TCAGCCAGAC CGAGGCCCGC 
TTTGTCCGCT GGGGGCTTGG ATCGCTGGTC TTTGCCAAGT TTGTTCCGGG TTTTTCAACG 
GTGGCACCAC CCATTGCCGG CTCATTGCGC ATGGGCTTGC CGGGTTTCCT GCTTGCCGCC 
GCCACCGGGG CTGCCCTGTG GGCCGGGCTT GGCCTGGGCA CGGGCTGGCT TTTGCGTAAA 
GAGGTGCATC GCGCCATCGA GGCGCTGGAC CAGAACTCCG GAAGCCTGCT CGGGCTGATC 
GCCGGCACGA TCGCGCTGTG GCTGGGCTGG AAGCTATGGC AGAAATATCG CTTCCGGCAA 
TTGTCGGCTG TCCCTCACAT CACGCCGGTT GAGCTTATGG CCGCAATGGA AACCGACCAG 
CCCCCGCTGG TGCTCGATCT GCGCGGGCAC AGCATGGTGG CCGAAACCGG CCCGATCACC 
GGTGCAACAG TGGCCGAACA TGACAGGCTG CTCGATGCCG TGGGCGAATG GCCCAAAAAC 
CTGCCTATCG TGACCTTGTG CGCCTGCCCG GAGGACGCCG GGGCGATACA GGCAGCCCGC 
CAATTGCTCA ACGCAGGCTT CCTGTCGGTA CGGCCACTCA AGGGGGGATA CGAAGCTTGG 
CTAGCGACCG CCAATGGGAA CAACGTCTGA

Protein sequence

MEISQLGEAL QRDAVWVVFL NVLLQQIGLP VPAVPTLLLA GSLIVGSWQF ASVLAAAIVA 
SVLADWVWYL AGRAFGYRVL AGLCKLSINP GSCVSQTEAR FVRWGLGSLV FAKFVPGFST 
VAPPIAGSLR MGLPGFLLAA ATGAALWAGL GLGTGWLLRK EVHRAIEALD QNSGSLLGLI 
AGTIALWLGW KLWQKYRFRQ LSAVPHITPV ELMAAMETDQ PPLVLDLRGH SMVAETGPIT 
GATVAEHDRL LDAVGEWPKN LPIVTLCACP EDAGAIQAAR QLLNAGFLSV RPLKGGYEAW 
LATANGNNV