Gene Dole_2444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2444
Symbol
ID	5695293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2955310
End bp	2956479
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	63%
IMG OID	641265051
Product	DNA protecting protein DprA
Protein accession	YP_001530325
Protein GI	158522455
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000433746
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATC TCACCCCCTG GTTTACTCTG AAAAGCGTTC CCGGCGTGGG CAACCTCCTG 
TTCAAGCGGC TGATCGACCG GTTCGGCTCA CCGGAGAAAG TGCTGAGTGC TGCCCGGTCC 
GACCTGCTGG GGGTCCAGGG CATATCAGAC ACCCTGGCCT CGGCCATCCG AGCCCACAAG 
ACACCGGACA ATATTGAAAA GGTGCTTGAG ACCTGCGCCC GGAAAGCCAT TTCCATCGTC 
CCCCTGACCG ATCCCGGCTA CCCCGCCCTG CTGCGGGAAA TCCATGACCC GCCCCCCTAT 
CTCTACGTGT GGGGAAAGCT GGTGCCGGAC GCGGGGTGCA TATCGATTGT CGGATCCCGA 
AGCCCCACCC GGTACGGCCT CTCCATGGCC ACCCAGTTGA GCGGCGAACT GGCCGCCATG 
GGCCTGTGTG TGGCCAGCGG TATGGCCAGG GGCATCGACA CCGCGGCCCA CACCGGGGCA 
CTGGACAACA ACGGCCTGAC ATACGCCGTT CTGGGCAGCG GCCTGTGCCG CATCTATCCG 
CCGGAGAACA TGGAACTGGC CCGGCGCATC GCCGGGCAGG GGGCCGTGAT ATCAGAGTTC 
CCTCTTTTTG CCGAGCCCGA CGCCCACCAC TTTCCCCTGC GCAACCGGTT GATCAGCGGC 
CTCTCCCTGG GCACCATCGT GGTGGAGGCG GCGGCCCGAA GCGGGTCCCT GATCACGGCC 
CGGCTGGCCA TGGAGCAGGG CCGGGAGGTA TTTGCCGTGC CCGGCAGCAT CACCTCCTTT 
AAAAGCACCG GTGCCCACGG CCTGCTCAAA CAGGGGGCGA TCCTGGTGGA AAAGGCATCG 
GACGTGATCG CCGAGATATC TCCCCGGCTT GCCGCCGGCC CCGCAACCGC CCCGGCGGCG 
TCGGACCGGG CCGATGAAAA CAAACACGCC GGAAAACCGA CCCCCGGCCT TGACACGGAT 
GAGGTACGGG TGTTACAAAC CCTTGAACCT TACCCGGTGC ATATTGACGA AATCGCCCAG 
AAGGCGGCCA TGGCGCCGGG AAAAACAGCA GGCATCCTGC TGCAACTGGA ACTCAAAGGG 
TTTGTAACCC AGGAACCGGG AAAACGGTTC CTTATTAACC CGGATGTTGC ACGAGCCGAT 
TTGGTCGCAG ATGCAAGGCG CGAGACATGA

Protein sequence

MENLTPWFTL KSVPGVGNLL FKRLIDRFGS PEKVLSAARS DLLGVQGISD TLASAIRAHK 
TPDNIEKVLE TCARKAISIV PLTDPGYPAL LREIHDPPPY LYVWGKLVPD AGCISIVGSR 
SPTRYGLSMA TQLSGELAAM GLCVASGMAR GIDTAAHTGA LDNNGLTYAV LGSGLCRIYP 
PENMELARRI AGQGAVISEF PLFAEPDAHH FPLRNRLISG LSLGTIVVEA AARSGSLITA 
RLAMEQGREV FAVPGSITSF KSTGAHGLLK QGAILVEKAS DVIAEISPRL AAGPATAPAA 
SDRADENKHA GKPTPGLDTD EVRVLQTLEP YPVHIDEIAQ KAAMAPGKTA GILLQLELKG 
FVTQEPGKRF LINPDVARAD LVADARRET