Gene Dole_3009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3009
Symbol
ID	5695868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3611015
End bp	3612262
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	59%
IMG OID	641265625
Product	extracellular ligand-binding receptor
Protein accession	YP_001530889
Protein GI	158523019
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000545529
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGAT TCGCAGCGAT AATCATCATC AGCGCCGCAC TGGCCCTGTG CTTCGGCACG 
GCCGGCATGT GCGAGGTCGG CGTGACCGAT ACCGAGATTC ACATCGGCCA GTGGGGTCCC 
CAGACCGGCC CGGCCGCGCC CTGGGGCGCC GTGGCCCGGG GTACCGACGC CTACTTTAAA 
ATGATCAATG CCGAAGGCGG CATTCACGGC CGCAAGCTGG TCCATCACTA TTTTGACGAT 
GCCTACAACC CGGCCAAGAC CGTGGCCGGC GTCAAGCAGC TTCAGGAACA GGAGGGCATG 
TTCGCCTGGG TCAGCGGCGT GGGCACGGCC ACGGGCCTGG CGGTCAAGGA CTACCTGATG 
GAAAACAAGA TTCCCTGGAT CGGTCCGTCT GCCGGTTCCC GCCACTGGGT GGAGCCGCCC 
CAGAAATACC TGTTCAACGT TTATCCCTTC TACATGGGCG ATGCCCAGCT CCTGTGCCAG 
TATGCCGTTG AAACCATGGG CAAGAAGAAA ATTGCCATTG CCTTTCAGAA TGACGACTAC 
GGCAAGCAGG GCGTGGAAGG CGCTGAGTAC CAGCTTAAAA AGGCGGGCCT GGAGCTGGCC 
GTCAAGGTGC CGGTCAACGT GGCTGATACC GACATGATTC CCCATGTCAT GGAGCTGAAA 
AAAGCCGGGG CCGACGCGGT GCTGCTGTTT GTCACCCCTG GTCATGTGGC CCGCATCATC 
GGCACGGGCA AGGCCATGCA GTTTGAGCCC ACCTGGATGT CCACCTCCAC CTGCGGTGAC 
TTTCCCCTGA TGATGGCCAT CACCAAGGGC CTTTGTAAGG GCCTGATCAC GGCATCTTTC 
GGTCTTGCCG AACCCACGGG CCATGTGGGG GAAGTCCAGC TTCTTGATAA TCCGGTTCAG 
AAAATGGTCG CCAAGTACAA GACCGATGCC TTTGACAAGT TCGCGGCCAA GGATGAACGG 
TACGGCTACA CCTTTCTCGC GGGTATCGGC TTTGCCGAGC CCCTGGTGGA GGCCATCCGC 
CGCTGTGGAA AGGACCTGAC CCGGGAGAAA CTGGTCAAGG AACTGGAAAA CATGAAGAAC 
TTCAAGGGCG TCCTGGGCCG TATCAACTAC AAGCCCTTTG ACCCCAAGGA CCCCCTCTGT 
CGCCTGGGCC AGGGAGAGGT CTTTCTCCAG GAGTGCACGG AAAACGGCGG ATCCAAGATC 
CTGACCGACT GGGTAACAAC CACCTACCTG CCGTCAAAGG CGGAATAA

Protein sequence

MKRFAAIIII SAALALCFGT AGMCEVGVTD TEIHIGQWGP QTGPAAPWGA VARGTDAYFK 
MINAEGGIHG RKLVHHYFDD AYNPAKTVAG VKQLQEQEGM FAWVSGVGTA TGLAVKDYLM 
ENKIPWIGPS AGSRHWVEPP QKYLFNVYPF YMGDAQLLCQ YAVETMGKKK IAIAFQNDDY 
GKQGVEGAEY QLKKAGLELA VKVPVNVADT DMIPHVMELK KAGADAVLLF VTPGHVARII 
GTGKAMQFEP TWMSTSTCGD FPLMMAITKG LCKGLITASF GLAEPTGHVG EVQLLDNPVQ 
KMVAKYKTDA FDKFAAKDER YGYTFLAGIG FAEPLVEAIR RCGKDLTREK LVKELENMKN 
FKGVLGRINY KPFDPKDPLC RLGQGEVFLQ ECTENGGSKI LTDWVTTTYL PSKAE