Gene Daud_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_0201
Symbol
ID	6026445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	232909
End bp	234480
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	58%
IMG OID	641593056
Product	transposase IS66
Protein accession	YP_001716395
Protein GI	169830413
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.228467
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCATGTG TCGAATTGGT AGACATGGAT AATGCAGCGA AAACCATCGA AGAACTCCAG 
ATAAAATGTG CTTTACAGCA ACAGCAAATC GCTGAACTAA CGGCCAAACT TAACTGGTTT 
GAAGAACAGT TCCGTCTCAG CCAACAGCGT CAATTCGGCC GCTCCAGTGA GCAGACCCAA 
AACCAAGTGG AGCTTTTCAA CGAGGCAGAG GCCGAAGCCA GAGCGTCTTT CGAACCAACG 
ATCGAGGAAA TCACCTACCG CCGCCGCAAA AAGCAGGGCC GGCGCCAGGA ACAGCTAAAG 
GATCTGCCGG AGGAGATCAT TGAATACCGG CTCGCTCCGG AAGAGCAGAG ATGTGCCTGC 
GGCGGCGCCC TGCACGAAAT GAGCACCGAG GTCAGGCAGG AACTCAAAAT CATTCCGGCC 
CAGGTCAGTG TCGTCAAGCA CGTCCGCTAT GTCTACGCCT GCCGCCGCTG TGAACGGGAA 
GACATCAAAA CCCCCATCGT CACCGCCCCG ATGCCGGCGG CGGTACTGCC GGGAAGCCTG 
GTTTCCCCCT CGGCCATGGC CTACATTATG ACCCAAAAGT ACGTGGAGGG CATGCCGCTT 
TACCGCCAGG AACAACACCT GGCCCGTCGG GGCGTGGAAC TCTCCCGCCA AACCCTGGCC 
AACTGGATGA TCCAGGGTGC GGATCGCTGG CTAAGCCTCC TGTATGCCCG GATGCACAAG 
CATCTACTGG CGCAAGACAT CCTGCACGCC GATGAGACGA CCTTGCAGGT ACTCAATGAA 
CCGGGCCGGT CGGCGCAAAG CACTTCCTAC CTCTGGCTTT ACCGCACCGG GCGGGCCGGA 
CCGCCAATAA TCCTTTATGA CTACCAGACC ACCCGGGCCA GTAAACATCC CCGCCGGTTC 
TTGTCCGGCT TTAAGGGTTA CCTGCATGTC GACGGCTATA CCGGCTACAA CGAACTGCCG 
GATGTGACCC TGGTCGGGTG TTGGGCGTAT GCCCGGCGCA AGTTCGACGA AGCGCTAAAA 
GCACTGCCCA ACGCCCAGCG CGGTGCGGCG GTGGCCGCCA AAGAAGGGTT GGAGTTCTGC 
AACCGTCTCT TTGCCATCGA ACGGGAGTTC CGTGAAGTCA CTCCCCAGGA GCGTCATACG 
CGTCGCCAGG AACTCAGTCG GCCGGTGGTG GAGGCTTTTT CAGCCTGGCT GAAATACCAG 
AGCCCCAGAG TTCTGCCGAA AAGCGCCTTC GGCCAAGCCA TCAAGTATTG CCGCAACCAG 
TGGGACAGGC TTACCGTTTT TCTGGAAGAC GGCCGCCTGG AGTTGGACAA CAACCGCAGT 
GAGCGCTCCA TTAAACCATT TGTCATCGGC CGTAAGAACT GGCTATTCGC GAACACCGCC 
CGTGGGGCAA GCGCCAGTGC CATCATTTAT AGTGTTGTGG AAACAGCGAA GGAAAACGGC 
CTCAACCCCT TCAGTTACCT GCAGTATCTT TTTGTAAAGC TGCCGAACAT GGATATTCAG 
GATGAACAGG CCTTAGAAGA GTTGCTTCCC TGGTCGGCAA CACTGCCACC GATCTGTCGG 
GGTGGCAAGT AG

Protein sequence

MPCVELVDMD NAAKTIEELQ IKCALQQQQI AELTAKLNWF EEQFRLSQQR QFGRSSEQTQ 
NQVELFNEAE AEARASFEPT IEEITYRRRK KQGRRQEQLK DLPEEIIEYR LAPEEQRCAC 
GGALHEMSTE VRQELKIIPA QVSVVKHVRY VYACRRCERE DIKTPIVTAP MPAAVLPGSL 
VSPSAMAYIM TQKYVEGMPL YRQEQHLARR GVELSRQTLA NWMIQGADRW LSLLYARMHK 
HLLAQDILHA DETTLQVLNE PGRSAQSTSY LWLYRTGRAG PPIILYDYQT TRASKHPRRF 
LSGFKGYLHV DGYTGYNELP DVTLVGCWAY ARRKFDEALK ALPNAQRGAA VAAKEGLEFC 
NRLFAIEREF REVTPQERHT RRQELSRPVV EAFSAWLKYQ SPRVLPKSAF GQAIKYCRNQ 
WDRLTVFLED GRLELDNNRS ERSIKPFVIG RKNWLFANTA RGASASAIIY SVVETAKENG 
LNPFSYLQYL FVKLPNMDIQ DEQALEELLP WSATLPPICR GGK