Gene Daro_2531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2531
Symbol
ID	3567565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2728302
End bp	2729501
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	637680998
Product	Phage integrase, N-terminal SAM-like
Protein accession	YP_285734
Protein GI	71908147
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.335158
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACTT TTAACGCTTC CCATTCCCGC CGCCGGGCTC AAGGTTCCAT TGGCTCGGGC 
CGTGCTGCCC AACACCAACC AGCACGCCGT CAGGAGTGGG CTTCACTCAC GCCCACCGAG 
ATTCTGAGCC GCTACCGGCC GGGCAAGGCC GATCCGCTAC AGGTGCTCGA TGTCCTGCTG 
GAACTGTTCA ACACGCAGCA CACCGCGCTC GACAAGACGG TCTCGCACAA GACACGACAG 
GAACGGGCCG ACTTCCTGCG CCGTTTCTTC CGAGACCTCA AGGTGAAGGC CAATTTCGCC 
ACCGTACCCG ATCCCCGTAA TCTCGGTGAC CGGCACATCC GGGCCATCGT CGCCGTCTGG 
CGCGAAGAGA GACTCGCTCC GGCGACAATC CAGACTTATC TGAGCTTCCT ACGTGGACTG 
GCGCTGTGGC TGAGAAAACC TGGCTTCATC CGGTCGCCGG CCTACTACGG CCTCTCGCCC 
AATGAATATC AGCGCGACGA AAACGCTCAG CGCGACAAGA GCTGGACGGC GGCAAGCATC 
GATATCGACG CCGTGGTTGA ACAGGTCATT GCGTTCGACC GCTACGTCGG CGCTTCATTG 
GGATTGATCC GGACGTTCGG CCTGCGCCGC AAGGAATCAG TGATGATCCG CCCGCATCTG 
TGCGTGGTGC CTTTCGAAGC CACAGGCCTG CCACCCGGGG AAAGGCAGGC CGACAACTAC 
GTGCGAATCA AGGAAGGCGC GAAGGGTGGA AGGCGGCGCT TTGTGCCACT GGATTCAGAG 
CAACGCATCG CAGCTTTAGA ATTCGCCCAG GCAGTCGTTC CGGGAGAGGA GGCGCATCTG 
GGCGATCCTC GCCACAGTCT TAAGCACAAC CTGCGGCGCT TCGACTATGT GATGGCGAAG 
TTCGGCATCA CGGCGGACGG CCTGGGTGCC ACGGCGCACG GGCTGCGCCA TGAAGCGATG 
ATCGACCACT ACACGACCAA GGCTGGCGGG ACGCCACCGG TCCGAGGCGG CGGTGATGTG 
CCTCCCGAGG AGGACGCGGC GGCAAGACTC TCGGCCGCCC GGCTGGCCGG ACACAATCGC 
GCTAGGGCGG CAGGCGCTTA TTTAGGTGGG CTACTGCCAC GACAAGCGGC GTTGAAGGAC 
CAGGCAAAAG ACAGCCTGCC CTGCACATCC GATGCGGAAA AATCACCCGG AGGGCATTGA

Protein sequence

MSTFNASHSR RRAQGSIGSG RAAQHQPARR QEWASLTPTE ILSRYRPGKA DPLQVLDVLL 
ELFNTQHTAL DKTVSHKTRQ ERADFLRRFF RDLKVKANFA TVPDPRNLGD RHIRAIVAVW 
REERLAPATI QTYLSFLRGL ALWLRKPGFI RSPAYYGLSP NEYQRDENAQ RDKSWTAASI 
DIDAVVEQVI AFDRYVGASL GLIRTFGLRR KESVMIRPHL CVVPFEATGL PPGERQADNY 
VRIKEGAKGG RRRFVPLDSE QRIAALEFAQ AVVPGEEAHL GDPRHSLKHN LRRFDYVMAK 
FGITADGLGA TAHGLRHEAM IDHYTTKAGG TPPVRGGGDV PPEEDAAARL SAARLAGHNR 
ARAAGAYLGG LLPRQAALKD QAKDSLPCTS DAEKSPGGH