Gene Dole_0833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0833
Symbol
ID	5693668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	966496
End bp	967647
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	57%
IMG OID	641263430
Product	extracellular ligand-binding receptor
Protein accession	YP_001528720
Protein GI	158520850
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000252201
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA GTATCCTGGC AACAGCGGCA GTGCTGGTTG TCATGCTGAT GTGCGGCGGC 
ATGCTTTACG CCGCTTCGGA CGATTACCGG GTGGGGTGTA TTTTTTCCGT TACCGGCAAG 
GCCTCATGGC TGGGTGAACC GGAAAAAAAG ACCGCGGAAA TGCTGGCTGA AAAAATCAAC 
GCCGCCGGCG GTATCAACGG TCACAAGCTG AAATTATATA TCGAGGATGA CCAGGGCGAC 
AACACCCGGG CGGTCAACGC GGCAAAGAAA CTGATCAACA GGGACAAGGT ATGCGCCATT 
ATCGGGCCGT CGGTTTCCGG CGCCACCATG GCGATTCTTC CGGTCATGCA GGAAGCCGAG 
ATCCCGCTGG TCTCCTGCGC GGCCGCCGCG GTTATTGTCG AGCCAGTGGC CGAGAGGAAA 
TGGATTTTCA AGACCCCCCA GAAAGACAGT GACGCCGTAC GGCGCATTTA CGAGCACATG 
ATCTCCAGGG GCATCAAGGA TGTGGGGCTG ATTACCGGAA CCACCGGTTT CGGTAATGCC 
GGACGCACCC AGCTCAAGGA CCTGGCCCCA GAATACAAGA TGAACATTGT GGCCGATGAA 
ACCTACGGCC CGGCCGACAC GGACATGACC GCCCAGCTGG TCAACATCCG CAACGCCAAG 
GCCCAGGCCG TTATCAACTG GTCCATCGTA CCGGCCCAGT CCATTGTTCC CAAGAACATG 
AAACAGCTGA ACATGACGAT TCCGTTGTAC CAGAGCCACG GTTTTGGCAA CATTAAATAC 
GTGGAAGCCG CCGGGGAAGC CGCTGAAGGG ATTATCTTTC CCGCCGGCCG GCTGCTGGCC 
GTGGACACCC TTTCCGGCGA CAATCCCCAG AAAGCCCTGC TGGCCGCTTA CAAGGCCGAA 
TACGAGGCCA GGTACAATGA GCCGGTGAGC ACCTTTGGCG GACATGCCTA TGACGCGCTC 
AGCATCGTCG TAAAGGCGCT GGAAAAAGCC GGCGACGATC CGGCCAAAAT TCGTGACACC 
ATTGAGACCA TTGAATTCGT GGGTACCGGC GGGGTCTTCA AGTTTTCGGC CGAAGATCAC 
ACCGGTCTGG ACAAGAACGC TTTTGAAATG CTGACCGTCA AGGACGGGAA ATTCGTCGTC 
CTGACAGACT AG

Protein sequence

MKKSILATAA VLVVMLMCGG MLYAASDDYR VGCIFSVTGK ASWLGEPEKK TAEMLAEKIN 
AAGGINGHKL KLYIEDDQGD NTRAVNAAKK LINRDKVCAI IGPSVSGATM AILPVMQEAE 
IPLVSCAAAA VIVEPVAERK WIFKTPQKDS DAVRRIYEHM ISRGIKDVGL ITGTTGFGNA 
GRTQLKDLAP EYKMNIVADE TYGPADTDMT AQLVNIRNAK AQAVINWSIV PAQSIVPKNM 
KQLNMTIPLY QSHGFGNIKY VEAAGEAAEG IIFPAGRLLA VDTLSGDNPQ KALLAAYKAE 
YEARYNEPVS TFGGHAYDAL SIVVKALEKA GDDPAKIRDT IETIEFVGTG GVFKFSAEDH 
TGLDKNAFEM LTVKDGKFVV LTD