Gene Daro_1641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1641
Symbol
ID	3569882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1764277
End bp	1765443
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	51%
IMG OID	637680109
Product	hypothetical protein
Protein accession	YP_284859
Protein GI	71907272
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATCC GCCCTCGAAT TATCGATAGT GAAGCCTCAT TCCGCCGGAA GGCGTATTAC 
TTTGCAAGTC CGGACTTGCT CGATTCGGCT GCGGCCTCGG CACTCATGGT TGCGCCTGAT 
TGCTTCCCAG ACCTCCTTGA AAAGCTGCAA GTGTTCATTC AGCAGGCCAA AGAGACCAAT 
GCCCCGCCTT TTTTGCCGGG AGTGAGCCGC ACGGGAGAGC CCATTACCAG TAAAAGCGAT 
CTCGCGACTC GGTATTTTTC CAGCACTCCG ATGTTCATCC GCTGCGTCCA GGCACTGTCC 
ACCAAATACC GCTACGACGC GCATGTGGAG GCCTTCATCG CGTGCGCAAA AGAAACTGGC 
CTGTACGACG CCAGATTTAT TGAATGGGGA AGTGCCGCGA CCGCCCATCA AATCTACCCA 
CCCGGGTTTG GTCAAAAAAC GGCAGCCGAT CTATTTAATG CACTCGTCGA TGCCCTTGGC 
AAGCGTTGTC GTTCCCCTGT CGTACGCGAA CAAATGCGCC AACGCAAAAA AGAGGTAGAA 
CGACGCTTAC GATCGTGCAG CACTTACGTC AAAAAGCTTT TTGCCAAGTA CAAACGCCTC 
GTTGTGATTC GCTTGGAATT GGGTTACCTG CCGGAACTTA CAGGCTCAAT CGAGTTTTCC 
CATGCCCTCG ACGATCTGGA TCGTTTTCTG AAGAATCAAT ACTGCAATGC CATCTTCAAC 
GACATGGTTG GTTACATCAT CAAGACCGAA TATGGCGTCA AAAAGGGAAT ACATCATCAT 
GTTTTCCTAT TCTTCAACGG CGACAAGCGG CAGGGTCGGT ATGCGGAGCA GATTGCCAAA 
TCCATCGGTG AATACTGGGC TGGCCCGGTA ACGCGGCATA AGGGCGATTA TTTCAACCGG 
AATGAAAAAA AGAACATTGA AGGTCTGAGC AAACGAGGAG TTTTGGGTAT TGGGCTCATC 
CATGCAAGCG ACGATGTACT TCGCGATAAC TTGATCAATC TCGCAATTTT TTACATCTGC 
AAGTCCGACC AGTATTTCAA GCCGAAAATT GACATGGATT TCCGTGCGCT CCGCATGGGT 
GGCGATCCCT TCAAGAAGAA GCCAAAATTA CGTCGAAAGG GCCGTTCCAA GCCCAACTCA 
GGGCATAGTG GCGACAGCAA AGCCTGA

Protein sequence

MLIRPRIIDS EASFRRKAYY FASPDLLDSA AASALMVAPD CFPDLLEKLQ VFIQQAKETN 
APPFLPGVSR TGEPITSKSD LATRYFSSTP MFIRCVQALS TKYRYDAHVE AFIACAKETG 
LYDARFIEWG SAATAHQIYP PGFGQKTAAD LFNALVDALG KRCRSPVVRE QMRQRKKEVE 
RRLRSCSTYV KKLFAKYKRL VVIRLELGYL PELTGSIEFS HALDDLDRFL KNQYCNAIFN 
DMVGYIIKTE YGVKKGIHHH VFLFFNGDKR QGRYAEQIAK SIGEYWAGPV TRHKGDYFNR 
NEKKNIEGLS KRGVLGIGLI HASDDVLRDN LINLAIFYIC KSDQYFKPKI DMDFRALRMG 
GDPFKKKPKL RRKGRSKPNS GHSGDSKA