Gene Dhaf_4664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_4664
Symbol
ID	7261692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	4975545
End bp	4976735
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	44%
IMG OID	643564577
Product	transposase IS4 family protein
Protein accession	YP_002461097
Protein GI	219670662
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCATA GCACTATCTT ACCAAAAAAC GAAGCAATGT TCAATTTCTT TAAAAGCCAT 
CGACTGCCCT TATATTTCTC AAAGCCTGTT TTACGACATA TTCAAGAATT TATTGTAGCG 
GCCACGGCTA AAGGATATCG TGGTAAGATA GTCGACATCG CGGAGTGGAG TTCGGTTCAT 
CGAACCTCTA TTGGTCATTT CCTCTCTCAT GGGGTATGGG ATGAATCTTA TATCCAGAAA 
ATTGTTAAAC AGGAATCTCT TCAATTTGTC GTAGCCCACT CCCAAAAGAC GGAGCAGCCC 
ATCTTTGTGA TTCATGATGA TACTGTTTGC AATAAGACGA AACCTTCGTC ACAGGCACAA 
CGTCCCATCG AGCAAGCAGA TTTCCATTTT TCGCACTTAG AGGGTAAGAG TGTTTGGGGG 
CATCAGGTTC AAGCAACCCT TGTTCAATGC GGTGACCACT CGCTCATTCA TGATGTTCAT 
CAATACGATA AAACCAAGCT AAGCAAAATT GATGACGCTT GTGAATTGGC TAAAACCATG 
CCGATTCCCC CTAAGTCAGG CTATGCCTTG GTTGATTCTT GGTATACCTG CGCCAAGCTG 
ATTAACACCT ATGCTGCACG AGGATACCAG CTGATTGGAG CTCTTAAAAC CAACCGCATT 
CTCTATCCCC AAGGGATTCG TGTTCGTCTC GATACCTTTG CCTCCTATGT GAACCCAAAG 
GAAGTTCACC TTGTGACCGT GAACGGTTCA TCCTACTGGG TTTATCGCTA TGAAGGGGCT 
CTAAACGATA TTGAGAATGC CGTAGTGCTG TTTTGTTGGC CTAAAGATGC TTTTCAGGTG 
TCTAAAGCCT TGCATGCCTT TTTGTGCACC GATGTTTCAT TAGAAACACA AACTATTTTG 
GCTTACTACA GTAAGAGATG GCCCATTGAG ATCTTCTTTC GGCAAGCCAA GGGAAATCTT 
GGTTTTAACG GCTACCAAGT ACGCTCAATC CGTTCCATCG AAAGATTCTG GGCTCTACTT 
TCTTTCACTC ATTTGTACTG CACCATGGGT TTAGGGAAGC CGCTGCTCTT TGGTGAAGGA 
TTGCGGAAAG TCCGAAAAGA GGTAAAAGGG CAATACATTC GATGGATTTA TGAGTGTAGT 
AGAAATGGAG TGCCTTTGGA AGATGTTTTA AAACGTCTTA AAGCTGCATA G

Protein sequence

MSHSTILPKN EAMFNFFKSH RLPLYFSKPV LRHIQEFIVA ATAKGYRGKI VDIAEWSSVH 
RTSIGHFLSH GVWDESYIQK IVKQESLQFV VAHSQKTEQP IFVIHDDTVC NKTKPSSQAQ 
RPIEQADFHF SHLEGKSVWG HQVQATLVQC GDHSLIHDVH QYDKTKLSKI DDACELAKTM 
PIPPKSGYAL VDSWYTCAKL INTYAARGYQ LIGALKTNRI LYPQGIRVRL DTFASYVNPK 
EVHLVTVNGS SYWVYRYEGA LNDIENAVVL FCWPKDAFQV SKALHAFLCT DVSLETQTIL 
AYYSKRWPIE IFFRQAKGNL GFNGYQVRSI RSIERFWALL SFTHLYCTMG LGKPLLFGEG 
LRKVRKEVKG QYIRWIYECS RNGVPLEDVL KRLKAA