Gene Dole_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0037
Symbol
ID	5692851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	43905
End bp	45068
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	59%
IMG OID	641262613
Product	TPR repeat-containing protein
Protein accession	YP_001527924
Protein GI	158520054
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000760847
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGTCAA AAACCTTTCT TTACTTTATG GCGCTTTTCG GCCTGGTATT TTTGTTTGCC 
TGCGGCCCCA AGGCAGTTGC GCCGGAAGCC CAGATGGACA CACCGGAACA CCATGTGACC 
AACGGCAACA AGTTTCTGAA GGCCGACAAG CTGGATGAAG CCTTTACCGC CTTTACCCGG 
GCGACCCAGC TGGACCCCAA ATACGCGCCG GCCTATGTGG GCCTGGGGCT GGTCCACGGC 
AAACAGGGAA TCTTTGACAA GGCATTTGAC GCCATGAAAC AGGCGGCCCG CTTTGCCAAA 
ACCGACGCCC AGCACGCCGA AACCAGTGTG GGTTACATCC GCCTGTACAC CATGGGCGGC 
CCGGCAGTGG AAGAGAACTG GCTCAACAAG GCCGGCAACC ATTTTGAGCG GGCCCACAAG 
CTGGCGCCCC GGGACCCGGC CCCCTATTTT TACATGGGCA TGGCCTATCG CAACGCCTAT 
CGTTTTTCAG ATGCCGCCGG CATGTTCAAG GCGGTGCTGG ACCTGGACAA AGACTTTGTG 
GAAGCCGCGG ACCGGGAGTA TGCGGTGATG CAGCGCATCG AACGGGCCAT GCCCGGCACC 
TCGGTGGGCA AGAAGATCGC CCTGCTGGAG GCCATCACCC GGGCCGACGT GGCCGCGCTT 
TTTATCGAAG AGCTGAAGGT GGACGAGCTG TTTGAAAAAA ATACACCCAA AACCTTTGAC 
ACCGCCTTCA AGGCCCCGGG CGCCGCTTTT AAAACCGGCG AGTATGTCAA GGCGCCGGCT 
GTCACCGACA TTGACAACCA TGTGCTGCGC CAGGATATTG AAGCGGTGGT ACGCCTTCAG 
ATCAAGGGCC TGCAGCCGGG TCCGGATCAC ACGTTTGAAC CGGACAAGTA TATCACCCGG 
GCCGAGTTCG CCATGATGAT CGAAGATATC CTGATCAAGA TCACCGGAGA CAACTCGCTG 
GCCACCCGGT TTATCGGCAC CGAGTCCCCT TTTCCCGACC TGCGCAGCGA TCTTGCCTTT 
TTCAACGCGG CCATGGTGTG CGTCACCCGG AATATCATGG AGACCGTTGA CACCGCCACC 
GGCGAATTCC GTCCCCAGGG GATGGTCTCG GGCGCGGACG CCCTGCTGAG CATTCGGCAG 
ATGAAGGTGC AGCTTAACAA ATAG

Protein sequence

MRSKTFLYFM ALFGLVFLFA CGPKAVAPEA QMDTPEHHVT NGNKFLKADK LDEAFTAFTR 
ATQLDPKYAP AYVGLGLVHG KQGIFDKAFD AMKQAARFAK TDAQHAETSV GYIRLYTMGG 
PAVEENWLNK AGNHFERAHK LAPRDPAPYF YMGMAYRNAY RFSDAAGMFK AVLDLDKDFV 
EAADREYAVM QRIERAMPGT SVGKKIALLE AITRADVAAL FIEELKVDEL FEKNTPKTFD 
TAFKAPGAAF KTGEYVKAPA VTDIDNHVLR QDIEAVVRLQ IKGLQPGPDH TFEPDKYITR 
AEFAMMIEDI LIKITGDNSL ATRFIGTESP FPDLRSDLAF FNAAMVCVTR NIMETVDTAT 
GEFRPQGMVS GADALLSIRQ MKVQLNK