Gene Dole_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2003
Symbol
ID	5694843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2425210
End bp	2426280
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	60%
IMG OID	641264601
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001529884
Protein GI	158522014
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00153551
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT GGACATATGG TCTTTTGATT ATGGTGCTGG GGATGGTTCT TTTATGCGCC 
TGCGGCCAGG GGCAGGATCA GGCAGCGGCA CCCCAGGCGC CGGAACAGGT CGCGGCGCCG 
GAGGCACCCG AAAAGGCCAT CGAACTGTCT TACAGCATCT TTTTCCCGCC CACCCATGAG 
CAGTGCAAGG CCGGTGAGGC ATGGGCAAAG GAGGTTGAAA CCAGGACCGG CGGCGCGGTC 
AAGATCAATA TTTTCCCCGG CGGCACCCTG ACCAAGGCCG ATGCCTGCTA TGACGGCGTG 
GTCAGCGGTA TATCCGACCT GGGCATGTCC TGTTTTGCCT ACACCCGTGG CCGGTTTCCG 
GTGATGGAGG CGGTTGACCT GCCCCTGGGC TATGCCAGCG GCACGGTGGC CACCCGGGCC 
GCGGACGCCT TTTACAGAAA GATGCAGCCC GAAGAGCTGA ACGATGTCAA GGTGCTGTAC 
ATTCATGCCC ATGGCCCCGG CCTGCTGCAT GCAAAAAAAC CGGTGACCTC CTTAGAAGAG 
ATGAAGGGTC TCAAGGTCCG CTCCACCGGC CTGAGCGCCA AGGTGGTGGA GGCCCTTGGC 
GGCGTGCCTG TGGCCATGTC CCAGGGCGCC ACCTACGAGG CCCTGCAGAA GGGCGTGGTG 
GAGGGCACCT TTGCTCCCAT TGAGACCCTT AAAGGGTGGC GCCAGGCCGA GGTGATCAAA 
CACACCACCG ACTGCCGGGA CATCGGCTAT ACCACGGCCA TGTTCGTGGT GATGAACAAG 
GATAAATGGA ACGCGCTTCC AGAACATATC AAGCAGGTGT TTGACGCGGT CAGCGCCCAA 
TGGGTCGGCG TCCACGGCAA GGTATGGGAC GATGTGGATG TGGAAGGCCG CAACTACACC 
CTGGAGCTGG GCAACACGAT TACGCCGCTG AGCGACGAGG AAAACACCCG ATGGGTTCAG 
GCGGTGGAAC CGGTGATTCA CGATTATATT ACTCAGGTTA ACCAGAAGGG AGTGGACGGT 
GCTGCCGCGG TGGACCAGCT TCGCGCCCTG ATCGCCGGTT TTAACGAGTA G

Protein sequence

MKKWTYGLLI MVLGMVLLCA CGQGQDQAAA PQAPEQVAAP EAPEKAIELS YSIFFPPTHE 
QCKAGEAWAK EVETRTGGAV KINIFPGGTL TKADACYDGV VSGISDLGMS CFAYTRGRFP 
VMEAVDLPLG YASGTVATRA ADAFYRKMQP EELNDVKVLY IHAHGPGLLH AKKPVTSLEE 
MKGLKVRSTG LSAKVVEALG GVPVAMSQGA TYEALQKGVV EGTFAPIETL KGWRQAEVIK 
HTTDCRDIGY TTAMFVVMNK DKWNALPEHI KQVFDAVSAQ WVGVHGKVWD DVDVEGRNYT 
LELGNTITPL SDEENTRWVQ AVEPVIHDYI TQVNQKGVDG AAAVDQLRAL IAGFNE