Gene Dole_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0940
Symbol
ID	5693775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1096596
End bp	1097606
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	62%
IMG OID	641263537
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001528827
Protein GI	158520957
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.756005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACTT CCGGTCCCAA CCTGCTTGAA GTCGAACGCC TGAAAAAATA TTTTCCCGTG 
CGGGGCGGCG TGTTTCTGCG GCCCGTGGCC CAGGTGCATG CCGTGGACGA CATCTCCTTT 
GCCATTCGAC CCGGAGAGAC CCTGGGCCTG GTGGGAGAGT CGGGCTGCGG CAAGACCACG 
GTGGGCCGCT GCGTGGCCCG GCTTTACGAG CCCACGGCCG GCGCCATCCG GTTTGACAAC 
ACCGACCTGG CCGGAGTCCG GGGCGCGGCC CTGCGGCGGC TGCGGCGTCA TATTCAGATG 
GTGTTCCAGG ACCCGTTCGA GTCCTTGAAT CCCCGCCACA CCGTGGGCAC CATGCTTGAA 
GAACCTTTTA AGATTCACCG CATCGGCACC GCCGTCGAAC GCCGGCAGTC AGTACAATCA 
CTTTTAGACC GGGTGGGACT TTCCGCAAAC GCGGCCGACC GGTTTCCCCA CGAGTTCAGC 
GGGGGCCAGC GCCAGCGCAT CGGCATTGCC CGGGCCATTG CCTTAAACCC GCGTATGATC 
ATCTGCGACG AGCCGGTGTC GGCGTTGGAT GTCTCCATTC AGTCCCAGAT TTTAAACCTC 
CTGCTCGACC TTCAGCAGGA ATCCGGGTTT ACCTGCCTGT TTATCGCCCA CGACCTGGCC 
GTGGTGCGCC ACGTTTCTGA CCGCATCGCC GTGATGTACC TGGGAAAAAT CGTGGAAATC 
ACCGACGCCG ACACCATCTA TGCCACGCCC CTGCATCCCT ACACCAGTGC CCTTCTCTCC 
GCCATTCCCA TTGCCGATCC CACCGCAAAG CGGCAAAAAC AGGTGCTTTA CGGAGACGTG 
CCCTCCCCGT CAGCGCCGCC GCCGGGCTGC CGGTTTCACA CCCGGTGTCC CCATGCCGCC 
GACATCTGCA AAACCTCCGA GCCCTCGCTG GTACCGGCCG CCTTTTCCCC GGCACCGGAT 
CACCAGGTGG CCTGCCACCG GGCCGAGGAG CTCAAAAATC TATTGATATA A

Protein sequence

MATSGPNLLE VERLKKYFPV RGGVFLRPVA QVHAVDDISF AIRPGETLGL VGESGCGKTT 
VGRCVARLYE PTAGAIRFDN TDLAGVRGAA LRRLRRHIQM VFQDPFESLN PRHTVGTMLE 
EPFKIHRIGT AVERRQSVQS LLDRVGLSAN AADRFPHEFS GGQRQRIGIA RAIALNPRMI 
ICDEPVSALD VSIQSQILNL LLDLQQESGF TCLFIAHDLA VVRHVSDRIA VMYLGKIVEI 
TDADTIYATP LHPYTSALLS AIPIADPTAK RQKQVLYGDV PSPSAPPPGC RFHTRCPHAA 
DICKTSEPSL VPAAFSPAPD HQVACHRAEE LKNLLI