Gene Dole_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3157
Symbol
ID	5696019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3783820
End bp	3784869
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	60%
IMG OID	641265776
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001531037
Protein GI	158523167
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00466763
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAA AGCAGGGCAT AATCAAAAAG GCGGTCTGGG TGCTGGCGGC TGTTGTCATG 
GCCGTCTGGG CGGCAGGACC TGTGACCATT GTCCGTGCCG ACACAGCGCC GAAGGTTGTC 
TGGAAGGTGG GGACACTCAC GCCCAAGGGC GTGGGCTGGG CCCACCAGTT TGAAACCATC 
ATGATGCCGG TTATTCAATC CGGCACCAGC GGCGAGCTGA AGGTGAAGGT GTACTGGGGC 
GGCCTGATGG GAGACGATGA GGATATCGTG GCCAAGATGC GGGTGGGCCA GCTTCAGGCC 
GCCGGCCTCA CCGGTCAGGG CGCCACCATT GCCTGCCCCG AGTTTGCCGT GGTGGAGCTG 
CCCTTTCTTT TTAAGAGCTA TGCCGAGGTG GACCACATTC GGGAAAAGAT GTGGCCTGAA 
TTCGACCGCC TGATGCAGGC CCGGGGCTTC AAGCTGCTGG CGTGGCTGGA TCAGGATTTT 
GACCAGATAT ACTCGGTGAA GTGGAGTTTT ACGGATCTTG CCGATTTTCA GAAGGCCCGG 
TTCATGACCT GGTACGGCAC TCTGGAAGAG CACCTGCTCA AGAGCCTCAA TGCCAGCCCC 
ATTCCCGTGA ACATTCCCGA GCTGGCGCCC TCCCTGCGCC AGGGCGTGGC CGACTCCCTG 
ATCGCGCCGG CCCTCTGGAT GATCGCCACT CAGCTCTACC CGGTGGTCAA CTACATGGTG 
CCGTTAAAGA TCCGTTACTC CCCGGCAGTG GTTGTCTGTA CCCTGGATGC ATGGAACGGC 
CTGTCGGCGT CGTCCCGGGC CGGCCTTGCC GCGGCCCGGC CGGAGATGGA AAAACAGTTT 
GTGGCCGCCT CCCGTAAGGA CAATCAAAAG GCTATGGACG CCATGGTCAA ATACGGCATT 
GTGCGGGTGG ACATGACCGA CGCCCAGGTG GAGACCATTC GAAAAGGGGC CGTGACCGTG 
TGGGACGATC AGGCCGATAA ACTTTATTCC AGGGAACTGC TTGACCGGAT ACTGGTCCAT 
CTGGACCAGT ACAGGAGCCA AACCCCGTGA

Protein sequence

MMKKQGIIKK AVWVLAAVVM AVWAAGPVTI VRADTAPKVV WKVGTLTPKG VGWAHQFETI 
MMPVIQSGTS GELKVKVYWG GLMGDDEDIV AKMRVGQLQA AGLTGQGATI ACPEFAVVEL 
PFLFKSYAEV DHIREKMWPE FDRLMQARGF KLLAWLDQDF DQIYSVKWSF TDLADFQKAR 
FMTWYGTLEE HLLKSLNASP IPVNIPELAP SLRQGVADSL IAPALWMIAT QLYPVVNYMV 
PLKIRYSPAV VVCTLDAWNG LSASSRAGLA AARPEMEKQF VAASRKDNQK AMDAMVKYGI 
VRVDMTDAQV ETIRKGAVTV WDDQADKLYS RELLDRILVH LDQYRSQTP