Gene Dole_3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3074
Symbol
ID	5695934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3683276
End bp	3684670
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	57%
IMG OID	641265691
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001530954
Protein GI	158523084
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000735359
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCATGC GGGATGGTCG TTCCAGAGGT GCGGGGTTGT GTGTGCTGGT GGTGTTGACG 
TTGATGCTGA TGCTGGCAGG AAAGCCGGAA AGCGGAATTG CGGCGGATGC CGATACAAAC 
GGAGTGCAGC AAACAGTGGC GGAGAGCCTG GAAGCCCTCT GGACCGGCAG GACGTTCAGC 
CCGGAGCTGC AGCAGCGGCA GCAGGCCATG AAAACGTTGC TGCAGAATGG AGCCGTAACC 
CGGGCCGACC TGGTAAGCAT GATGGAAACC GCGTTTCTTC CCATGCTGGA CCGGGCCGTC 
ACGTCCCGGT ATATCCTGAA AGCCATGGCC AGGGATTTTG ACGCCGTTTT CGCGCCCCAC 
ATGACATGGG AGGATGGGCG CGAAATGATG TGGCGGGTCA GCACGTCGGT GGTAAAGAAG 
GGGGACCAGG TGTTGATTAA AATCGGCACA CTGGCGCCGC CGGGAACACC GTGGCTGAGC 
GTTCCCGAGA CCATTACCAT TCCCGAGATC GAAAAAATGA CTGAGGGAAG GGTGACCGTC 
AAGATATACG GCGGCGGCGT CATGGGCGAG GATACCGATA TTTTAAGAAA GATGGATATC 
GGCCAGCTCG ACGGCTGCGG CTGCACCTCC CTGGGCGTGC TGGCCGCTTC CCCGGAAACC 
TCTGTTTTTC TGGTGCCCGG CCTGTTCAAG AGCTATGACG AAGTGGATTA TGTCTATGAA 
AAGTTTCGCA AGCGCCTGGA CCGGGCCTTT GAAGAAAAGG GATATATTCT GGCAGCCCTG 
ATCGACACCG GTTTTTTCCA CATCTTTTCA AAAAACAGGA TCGCCGGGCT GGAGGATGTG 
AAAAAGCAGA AGATGCTGAC CTGGTTTGGC ATCATGGAGA CCACCCTGTA TAACGAGCTG 
GGCATCAACC CCACGCCCGT GGCCGTGCCC GAGGTGGTGT CCGCCTTGAG CACGGGCCTG 
GCCAACACCA ACCTGGCGCC GGCCGCCTGG ATGCTGGGCA TGCAGGCCTA CCAGTACGCC 
AACTACTATC TGACCCCGGC TCTGATGTAT TCCCCGGCGG CCATTGTGGT CAGCACCAAA 
ACGAAGGACC GGATTCAGAA GCAGGTGGGG GTCTCGGACA ACTACGCCCA GAACTTCCAG 
GAGATCATTG TTTCCGAGTT CAATCTCATT GAGGGGGAGT GGCGGCGTCA GATTCGGGTT 
TATGACGCCA AAAGCCTGAA AGCTTTTGAA ACCAAGTGCG GTATGAAGGC CATGACCTTT 
TCCGCCGAAG ATCAGAAGCT TATTGAGCAG GCGGGTATCG CGGTTCGGGA AAAGCTGGCC 
GGCAAAGCTT ATCCGGCGGA CCTGCTTAAC GAGATCCTGG CGGCCCTGGA GGAGTTCCGG 
AAATCGCACC CGTAA

Protein sequence

MFMRDGRSRG AGLCVLVVLT LMLMLAGKPE SGIAADADTN GVQQTVAESL EALWTGRTFS 
PELQQRQQAM KTLLQNGAVT RADLVSMMET AFLPMLDRAV TSRYILKAMA RDFDAVFAPH 
MTWEDGREMM WRVSTSVVKK GDQVLIKIGT LAPPGTPWLS VPETITIPEI EKMTEGRVTV 
KIYGGGVMGE DTDILRKMDI GQLDGCGCTS LGVLAASPET SVFLVPGLFK SYDEVDYVYE 
KFRKRLDRAF EEKGYILAAL IDTGFFHIFS KNRIAGLEDV KKQKMLTWFG IMETTLYNEL 
GINPTPVAVP EVVSALSTGL ANTNLAPAAW MLGMQAYQYA NYYLTPALMY SPAAIVVSTK 
TKDRIQKQVG VSDNYAQNFQ EIIVSEFNLI EGEWRRQIRV YDAKSLKAFE TKCGMKAMTF 
SAEDQKLIEQ AGIAVREKLA GKAYPADLLN EILAALEEFR KSHP