Gene Dole_0944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0944
Symbol
ID	5693779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1102025
End bp	1103041
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	58%
IMG OID	641263541
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001528831
Protein GI	158520961
COG category	[R] General function prediction only
COG ID	[COG4174] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000124721
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCAT ATTTTATTCG ACGATTCCTG CTGATCATTC CCACCTTTCT GGGCATCACC 
GTACTGGTGT TCGCGGTCAC GCGGTTTGTG CCCGGCGGCC CGGTGGAACG CATGATTGCC 
GAGTCCTACC GCATGCAGGC CATGGAGGGC CGCACCCAGC GGGAGGCCAC CCAGCCCCTC 
TCCGAAGAGC AGATCAATTA CCTGAAACGC TATTACGGGT TCGACAAACC GGTGCCGGCA 
GCCTATGTGC TCTGGATGGG AAAAGTTCTG TCCGGCGACC TGGGCACCTC CACCCGGTAT 
TATGACCCGG TATGGGAGAT GATCCGGTCC CGCATACCCA TATCGCTCTA TTTCGGCCTG 
CTCTCTATGG TCATTATATA CGGGGTCTGC ATTCCCCTTG GCATGGCCAA GGCCGTGCGC 
CACAAAAGCG GGTTCGACAA CTTCACCTCC GTAGCGGTGT TTGCCGGCTA CGCCGTGCCC 
GGCTGGGTCC TGGGCATTCT GCTGCTGCTG CTCTTTTCTT CCCGGTGGGG GGTGCTGCCC 
CTGGGCGGGC TCACAAGCGC CGGCTTTGAC GCCCTGTCCG GACCTGAAAA AATTCTCGAT 
ATCGCCCGGC ACACGGTCCT GCCCCTGGCC GCCTACGTTG TGGGCTCCTT TGCCGTAATG 
ACCTTTTTAA TGAAAAACAC CCTGATGGAC GAACTGGCCG CCGACTATGT GCGCACGGCC 
ATGGCAAAAG GGCTGTCATT TAAAAAAGCG GTGTTCGGCC ATGCCTTAAG AAACAGCCTG 
ATTCCCGTTG CCACCAGCTT CGGCAACAAC ATATCGGTCC TGGTCTCGGG CTCGTTTCTC 
ATTGAAACGG TCTTCAACAT CAACGGCATG GGCCTTTTGG GCTACGAGTC GGTGGTGGAG 
CGGGACTATC CCGTGGTCAT GGGCATTCTG GTGATCTCGT CGCTGCTGTT TTTAATCGGC 
AACATTCTTT CCGATATCTG CGTGGCCTTT GTGGACCCGC GGGTGAGATT CCAGTAA

Protein sequence

MRAYFIRRFL LIIPTFLGIT VLVFAVTRFV PGGPVERMIA ESYRMQAMEG RTQREATQPL 
SEEQINYLKR YYGFDKPVPA AYVLWMGKVL SGDLGTSTRY YDPVWEMIRS RIPISLYFGL 
LSMVIIYGVC IPLGMAKAVR HKSGFDNFTS VAVFAGYAVP GWVLGILLLL LFSSRWGVLP 
LGGLTSAGFD ALSGPEKILD IARHTVLPLA AYVVGSFAVM TFLMKNTLMD ELAADYVRTA 
MAKGLSFKKA VFGHALRNSL IPVATSFGNN ISVLVSGSFL IETVFNINGM GLLGYESVVE 
RDYPVVMGIL VISSLLFLIG NILSDICVAF VDPRVRFQ