Gene Dole_1859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1859
Symbol
ID	5694699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2249026
End bp	2251086
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	61%
IMG OID	641264457
Product	TonB-dependent receptor plug
Protein accession	YP_001529740
Protein GI	158521870
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4206] Outer membrane cobalamin receptor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000014407
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTG CAATTCGTAC CCTGCTTTTG ACGGGTTGTA TAATTTACTG TGGTGCCGCC 
GTGGCTGTTC AGGCGGATGA ACAAAAGGCC CAGGCCACGG CCATGCTGGA TGAGATCGTG 
GTGACGGCCA CCAAGACCGA GGAGACCCGG AAAGATGTAC CGAATGCCGT AATCGTTATC 
GACCAGGCCG CTATTGAAGC CTCCACCGCC GACACGGTGG GGGAGCTGCT GGCCAATGAG 
CCGGGCGTTG ATTTCCGGAC CCGGGGCGAC TACGGCGGCG CGGCCCAGTC CCTTAACATC 
CGGGGCATGA GCGACACAGA GGTCCAGGTC ATGGTCAACG GCGTTTCCGC CAACTCCCCT 
TCCCTGGGAT CGGCGGATAT CGGCACCATT CCTTTGAGCA GCATCGAGAG AATCGAGATC 
GTAAAGGGAT CAGGCTCCAT GCTGCACGGT TCCGGGGCCA TGGCCGGGGC GGTCAACATT 
ATCACCAAGC GGCCGAAACG GGATCGCATG GACGCAAAGG CCTCGGCCGG TTACGGCACG 
GACAACACCT ACCAGCTTGC CGCCGAGCAC GGGCAGTACA TCGGCGACTT CGGCTACTAT 
CTTACTGCCG GGCAGCAGGA GACCGACGGC CGGCGGGACA ACGGCGACAT GGAGCAGCAG 
GACGCCTCCC TGGCCCTGGT TTTAGACAGG GATGACCTTC TGAATGTCAC CCTGAACGGC 
AGCGTGGTGG ACCGGGAGTT CGGCGTGCCG GGCGTCAAGC CGCCGGCCGG CACCGGCACC 
CATTACGTGG GCGGCGTGGC GTTTTACAAC GCGGATTCGG CCAGCCTGGT GGATAACGGC 
AGCGACACCA CCTACCAGGC ATCCCTGGAG ATTAAAAGCC GGCCGACCGA CTGGCTGGCC 
GTCAACCTGA AGCCTTTTTA CAGTGACCTG GAGAACTACC ACTCTACCCG GTACAACGAC 
ACCTCCTGGG GCCACCTGGC CGGCGAGGGG TACAAAACCT GGGTTTACAA CACGGTAAAA 
GGAATTGACG GTCATGTGGC CCTGGATCCG GTCGACGGCC TCACCCTGCT GCTGGGCGGT 
GACTACAAAG ATTATGAGTG GGAGACCGAG CAGTCTTTTC TGGATGTCAG CGGCGCGTTC 
AACCCTGCCA TTCCCGTGGC CACCAACGAT GCCAAGCTCT TTACCAAAAG CTGTTTCGGA 
GAGGTGCAGT ACCGGCCCAG CCAGTATGTC AAGTTGCTGG CCGGTGTGCG GGAGGAGAAC 
CACTCCACCT TTGGCCGGGA AACCCTGCCC CGCTATGGCC TGGTGTTCAA CCCCACCGGC 
AGCACCGCGG TCAAGTTCAG CCACGGCAAG CATTTCAAGG CTCCCACGCC CAATGACCTG 
TTCTGGCCGG AAGATGATTT TACCCGGGGC AACCCCACCC TCAAACCCCA GACCGGGTGG 
CACACCGACG TGACCATTGA ACAGGGCCTT TGCCAAAACG CCCTGCTGGT GACTGCCTCG 
GCCTTTACCT GGGACATTGA CGACAAGATC GACTGGGCAC CCAACCCGGC ATTTCCCGGC 
CCCTATGGTG ACAAGTGGAC CCCCACCAAC GTGAACTCCA GCCGGGGACA CGGCTGGGAG 
GCGGGCCTTC GGATTCAGCC GGAGGAGCAC TGGGCCGCCG ACATCAGCTA CACCTACACC 
TCGGCCACAG ACACGCTTCA GTTTGTGGAG CGGACGGCCC AGTACCTGGC AAACCACCGG 
GCCAAAATCG GCGGGTCTTA CCGGTTCGGC TTCGGCCTGA CCACGGCCCT GACCTGCCGG 
TACGTGGGCA CCCGGGATTT TTACCGCAGC AGCTACGACA GCCTGCCCAC CGACCGGCTT 
GACTCCTATA TCACGGTGGA CCTGAAAGCC GAGCAGCGGC TGGCCGGCCA CTGGATTCTC 
ACCCTGCGGG CCGACAACCT GATCGACGAG GAATATGACA CCTATGTGGG CACCTTTACC 
GACAGCGCCG GCGCCATGCA GTACGGCCGG TTCCCCGGCG GCGGCAGCTC ATATTTTGCC 
AGCGTTGGAT ATGAATATTA A

Protein sequence

MKLAIRTLLL TGCIIYCGAA VAVQADEQKA QATAMLDEIV VTATKTEETR KDVPNAVIVI 
DQAAIEASTA DTVGELLANE PGVDFRTRGD YGGAAQSLNI RGMSDTEVQV MVNGVSANSP 
SLGSADIGTI PLSSIERIEI VKGSGSMLHG SGAMAGAVNI ITKRPKRDRM DAKASAGYGT 
DNTYQLAAEH GQYIGDFGYY LTAGQQETDG RRDNGDMEQQ DASLALVLDR DDLLNVTLNG 
SVVDREFGVP GVKPPAGTGT HYVGGVAFYN ADSASLVDNG SDTTYQASLE IKSRPTDWLA 
VNLKPFYSDL ENYHSTRYND TSWGHLAGEG YKTWVYNTVK GIDGHVALDP VDGLTLLLGG 
DYKDYEWETE QSFLDVSGAF NPAIPVATND AKLFTKSCFG EVQYRPSQYV KLLAGVREEN 
HSTFGRETLP RYGLVFNPTG STAVKFSHGK HFKAPTPNDL FWPEDDFTRG NPTLKPQTGW 
HTDVTIEQGL CQNALLVTAS AFTWDIDDKI DWAPNPAFPG PYGDKWTPTN VNSSRGHGWE 
AGLRIQPEEH WAADISYTYT SATDTLQFVE RTAQYLANHR AKIGGSYRFG FGLTTALTCR 
YVGTRDFYRS SYDSLPTDRL DSYITVDLKA EQRLAGHWIL TLRADNLIDE EYDTYVGTFT 
DSAGAMQYGR FPGGGSSYFA SVGYEY