Gene Daro_3434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3434
Symbol
ID	3568330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3686041
End bp	3687066
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	637681906
Product	transposase IS116/IS110/IS902
Protein accession	YP_286633
Protein GI	71909046
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTG TCACTGTAGG CATCGATCTC GCCAAGAATG TATTCGCTTT GCATGGTGTT 
GACCAGTATG GCAAAGCCAT TTTTATCAAG CCAAAAGTAG CGCGCGGCCA ATTGCTGGAA 
ATGGTCGCCC AGCTACCGCC CTGCCTGATC GGCATGGAAG CCTGCTCCGG TGCTCACCAT 
TGGGCGAGAG AGTTCAGCCG CGTCGGCCAC ACCGTGAAGT TGATGGCACC CAAGTTTGTG 
GTGCCGTACC GGATGAGCGG CAAGCGCGGC AAGAACGACG CCGCCGATGC CGCGGCCATC 
TGCGAGGCCG TCACGCGGCC GAACATGCGT TTCGTCCCGG TCAAGGATGT CGATCAGCAG 
GCCATCCTCT GCCTGCACCG CACCCGGCAA GGTTTTGTTG AAGAACGCAC CGCGCTCTAC 
AACCGCTTGC GCGGCCTGAT CAGCGAGTTC GGCATTGTGC TGCCACAGAA AGTCGAACGC 
CTGCGCCGGG AAATCGGTGC CCACCTCGAA GCACTGCCCG GCTGGGCCAA CCGCTGTGTC 
GGTGATCTGC TGGCTCACGC CGACCGACTG AATGAACACA TCGACGAGTA CGACAAAGCC 
ATCGCCCTGG CCGCCAAACA AGACCAGCGG AGCCGGCAGC TCATGCAACT TCCTGGCATC 
GGCCCGACCA CCGCCAGCGC CCTGGTTGCC AGCCTGGGCG GCGGCCACGA CTTCAAGAAT 
GGTCGGCAGC TTGCCGCCTG GGTCGGGCTC GTTCCCGGCC AATACAGCAG TGGCGGCAAA 
GCCCGGCTGG GCAGGATCAC CAAGGCCGGC GACGCCTACC TGCGCAGTCT GCTCGTCATG 
GGCGGCCGAT CTGTTCTCGC CGGACTCGGT GACAAGCAAG ACCGCTTCAG TCGTTGGGCC 
AGAAATCTAG TCGAGCGACG CGGGTACTGG AAAGCGGCGG TTGCCATCGC CGCCAAGAAC 
TTGCGACTCG CCTGGGCGGT CATGCACTAC GGAGAGGAAT TTCGGCGTAT CGAAGATCTC 
GCCTGA

Protein sequence

MNIVTVGIDL AKNVFALHGV DQYGKAIFIK PKVARGQLLE MVAQLPPCLI GMEACSGAHH 
WAREFSRVGH TVKLMAPKFV VPYRMSGKRG KNDAADAAAI CEAVTRPNMR FVPVKDVDQQ 
AILCLHRTRQ GFVEERTALY NRLRGLISEF GIVLPQKVER LRREIGAHLE ALPGWANRCV 
GDLLAHADRL NEHIDEYDKA IALAAKQDQR SRQLMQLPGI GPTTASALVA SLGGGHDFKN 
GRQLAAWVGL VPGQYSSGGK ARLGRITKAG DAYLRSLLVM GGRSVLAGLG DKQDRFSRWA 
RNLVERRGYW KAAVAIAAKN LRLAWAVMHY GEEFRRIEDL A