Gene Dole_3229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3229
Symbol
ID	5696092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3872216
End bp	3873397
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	66%
IMG OID	641265849
Product	hypothetical protein
Protein accession	YP_001531109
Protein GI	158523239
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0121849
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATC GGTGTGTCGT GTCTGTGTCG TGGCTGGTGG CCGTGTGTGG CATGGCTGTT 
GCGGGCCTGT TTTTTTCTCC GGCTTTGGCA AGGTCTGCCG CCGGTGGAGA CACTGCCGTG 
ACCGTGAATG TGGTGGGCAC CGGCGTTGAG ACGCAGGATA CGGATGCGGC CGCGGCCAAG 
CGGGAGGCCA TTGACAACGG GCTCTCTTTG GCCGTGGACG AGGTCATGCG CCGGGTGGTG 
ACCCAGGAGA TTCTGGCGGC CAATTTTGCC GACCTGGACG CGGCGGCCCG GGCGGTTGAA 
GGCCAGGCCA TCCTGACCTA CCAGGTGCTG GCCGATGCCC GGCGGGAGGA TGTGTGCCGG 
GTCCTGGTCC GGGCCTCGGT GTCAACGGAC CAGTTGCGGC GGCAGGTGCT GCGGGCCGGC 
GTGCTGCCGG ACAGGGAGAA TATGCCGGGT GTAATGCTGC TTCTGCTGGA TGCCGACAAT 
GACGGCCCGG CCGTGGCTGC CAACCAGGCC ATGACCGACA GCCTTTTAAA AAGGGGGTTT 
CGGCCGGTGG CCGGATCAGA AAGCCTGCTG GCCGGGGAAT CGGGCCAGGC CGGGGCGGAC 
ATGGCGCCGG CCCGGTTCGT GTCGCTGGGC CGGGAAATGG GAGTGGATTT CGTGGTGACC 
GGTCATGTGG CGGCCACTCC GCCGGTGCGC ACCGGCAGGG AGTCGAAAAC CGGATGGCAG 
GGCACGATCA ATGCCCGGGT GGTGAGCACG GATACAGGCC GGGAGGTGTT TTCCCTGGCC 
ACCGAGGTGA TGCCGCCTGA CGAAGAGACG CTCTTTTTTG ACAAGGCCAT GGTGCAGGCC 
GCAGCCGGGG CCCGGGCCGC AGCCGGGCTG TCGCCCGCCA TGGCCGTGGC CTGGGACCGG 
CAGCAGGTGC AGACCCGGAG TTTTGATGTC ACGGTGCGGG GCGTGGGCTA CCTTGCCCAG 
CTGGGGTCGT TTCGGTCGGC CGTGGAGTCC CTTGCCCCTG TCAAGCGGGT CCAGATACGG 
GAAATGAAAA TCGACGAGGC CCTGGTGGTG GTTCAGGCTA TGGGCGGGGC CGAGGCCCTG 
GCCGGTGCCA TTGGCGCGAT CCGGGCCGAC GGGTTTTATG TTCAGGTGCT GGATGTGGTT 
GAGAACCGCA TGACCGTTGA AATTATTTCA GACGGCCACT GA

Protein sequence

MKNRCVVSVS WLVAVCGMAV AGLFFSPALA RSAAGGDTAV TVNVVGTGVE TQDTDAAAAK 
REAIDNGLSL AVDEVMRRVV TQEILAANFA DLDAAARAVE GQAILTYQVL ADARREDVCR 
VLVRASVSTD QLRRQVLRAG VLPDRENMPG VMLLLLDADN DGPAVAANQA MTDSLLKRGF 
RPVAGSESLL AGESGQAGAD MAPARFVSLG REMGVDFVVT GHVAATPPVR TGRESKTGWQ 
GTINARVVST DTGREVFSLA TEVMPPDEET LFFDKAMVQA AAGARAAAGL SPAMAVAWDR 
QQVQTRSFDV TVRGVGYLAQ LGSFRSAVES LAPVKRVQIR EMKIDEALVV VQAMGGAEAL 
AGAIGAIRAD GFYVQVLDVV ENRMTVEIIS DGH