Gene Dole_1197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1197
Symbol
ID	5694031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1430078
End bp	1431289
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	60%
IMG OID	641263790
Product	hypothetical protein
Protein accession	YP_001529080
Protein GI	158521210
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00107487
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAACGCA CGGTTCAGAC AATATCTATC GGTGTGCTGC TGCTGGCCTT GACATTGCTG 
GCGTCGGCCG GCGCTTGGGC CCAGGAAGAG ATTCATACCG TTACCGCCGA AGGGGTGGCC 
GTGATCACCG ACGGCAACAT GGCCTCGGCC AGGGACGGCG CCGTCAACGA CGCGCTGCGC 
CGGGCCGTGG AGCAGGCCGT TGGCACCATG GTCTCCGCGG AAACCGTGGC GGAAAACTAC 
ACGGTGTTAA GCGACCGGGT CTATTCCAAA ACCGCCGGGT ATGTGAAAAA TTACGAGGTG 
CTGTCGGAGA TGCCGGAGAC CCAGCTTTAC CGGGTAACGG TCAAGGCCGA AGTCTCAAAG 
GCGGATATTC AGAATGATCT GTCGGCCCTG GGCCTGCTGA TGGCCAGAAA GAACATGCCC 
CGCGTCATGA TCATGGTGGC CGAGCAGAAC ATCGGCCAGA CCACTTATGC CTACTGGTGG 
GACCGCAGCA TGACCACCCA GACCGACATG ACCATCACGG AAAACACCCT GATGGAAAAA 
CTCTCGGGAA AGGGGTTCAA CGTGGTGGAC CATACCGTAG CGGACAGAAC CGTTGAACTT 
TCCAGTGCCT ATAAAATCGC GGACCTGACC AATGACGCCA TGCAAAAGGT TGGGCAGCTC 
TATGGCGCCG AGGTGGTGAT CTACGGAAAG GCCTATGCCA AGCTGCGGGG CTCGGTACTG 
GGCACGGCCA TGCAGTCGGC CATGGCCAAT ATCTCCCTGC GGGTCGTCAA CACCGATAAC 
GGCGCGGTGC TGGCCACCAC CACGGCCAAT GCCGCGGCGG CCCATCCCGA TGAGATGACC 
GCCGGCGCCA ATGCCCTGAA AAACGTTACC GAACAGGCGG CAGATCAAAT CATCACCCAG 
ATTGTGGAAC GCTGGAGCAA CGAGGTGAGC GGCGCCGGCC TGATCCAGGT CACGGTGACC 
GGGAATGTGA CCTACAGCCG TCTGGTGGGC CTGAAAGACA CCATTCAGGC CCAGGTCCGG 
GGCGTACGGG CCATTCACCA GCGCAGCTTC GAAGGACAAA AAGCCCTGCT TGATGTGGAA 
TTTTCAGGTT CGGCCCAGGA GTTTGCCGAC GGTGTCTCCC GGGCCGACTT TAATGGATTC 
GCTGTGACCG TAAGCGGCGC CACCCAGAAC AGCGTCACCC TGAAAGTGAC CGACAGCGCC 
ACTACATTCT AG

Protein sequence

MKRTVQTISI GVLLLALTLL ASAGAWAQEE IHTVTAEGVA VITDGNMASA RDGAVNDALR 
RAVEQAVGTM VSAETVAENY TVLSDRVYSK TAGYVKNYEV LSEMPETQLY RVTVKAEVSK 
ADIQNDLSAL GLLMARKNMP RVMIMVAEQN IGQTTYAYWW DRSMTTQTDM TITENTLMEK 
LSGKGFNVVD HTVADRTVEL SSAYKIADLT NDAMQKVGQL YGAEVVIYGK AYAKLRGSVL 
GTAMQSAMAN ISLRVVNTDN GAVLATTTAN AAAAHPDEMT AGANALKNVT EQAADQIITQ 
IVERWSNEVS GAGLIQVTVT GNVTYSRLVG LKDTIQAQVR GVRAIHQRSF EGQKALLDVE 
FSGSAQEFAD GVSRADFNGF AVTVSGATQN SVTLKVTDSA TTF