Gene Dole_1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1194
Symbol
ID	5694028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1426056
End bp	1427171
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	60%
IMG OID	641263787
Product	hypothetical protein
Protein accession	YP_001529077
Protein GI	158521207
COG category	[R] General function prediction only
COG ID	[COG5621] Predicted secreted hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000162993
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCTACC AGAAAAGGGT TTTGACGACA GGCGCAGGGC GCTGGATGGC CCTGCTTTTT 
TTATGGTGCG TGGTGACGCT GGCCGGATGT GCCGGCAACC GGGTGCCCAT TGACACCGCC 
TATCCCACCA GGCCCATGTC GCTGCCGGCC GACCTGGCGG CCCATGACGG GGCTGAAACC 
GAATGGTGGT ATTATACCGG CCACCTGGAA GATGCCGAAG GCGGCCGTTA CGGGTTTGAG 
CTGACCTTTT TCAAGCGCCG CATCGACAAT GACAAGCCCT GGGGCATTCC CGTGGGATGG 
ATCGACGACA CGGCCCTGAT GGCCCATTTT TCCGTGACCT GTGAAGAGAC CGCCGAGTTT 
GTTCAGGACG GCCGGACCTG GTTTTCCAAC AAAAATATTT ATGCCCGGAC CGATCGGTAC 
GAGGTGGCCT ATAAGGACTG GAAGGCCGGA GGCGACATGG AACGGCACAC GCTGACGGCC 
CGGACAAAAG ATACCGCCAT CGACCTTTCG GCCACTCCCG TCAAGCCGCC GGTGCTGCAC 
GGCACGGACG GCATTGTGCC CAAGGGAGAG AACCGGGCCA ATTACTACAT GTCTTTTACC 
CGGCTGGCTC TGGCGGGTAC CCTGGTCTTT AAAGGCAAAG AGATTCCTGT TACCGGCACT 
GCCTGGTTTG ATCACGAGTT CGGTTACATG GGCACCACCG CGGTTTCCGG ATGGGACTGG 
TTTTCCCTTC AGATGGAGGA CGCCACCGAG TACATGCTCT ACGCGCTTCG TCTTAAGGAC 
GGCACCATCG ATCCGGTAAG CCATGCCTTT CGCATCGACC CTGAGGGAAA GTCGGAAAAC 
CTGCCCCTGT CCGACCTTGA TATCACGGTT CTTTCCAGGT GGAAAAGCCC CCACAACGGG 
GCCGTCTATC CGTCGGCATG GCGCATCGTG GCCGATCCCT GGGGCCTTGA TGTGATCGTG 
ATTCCAACGG TGGCCGACCA GGAGTTCCGG TATCATGACA TCGTCTACTG GGAGGGAAGC 
TGCGGCGTAT ATGGCGAGCC GGCCAATGGC CGGGCCTATG TGGAACTGGT GGGCTACTGC 
CCCTGGAAGG CCATGGCCGA CCTGCTGGAG GAGTAG

Protein sequence

MIYQKRVLTT GAGRWMALLF LWCVVTLAGC AGNRVPIDTA YPTRPMSLPA DLAAHDGAET 
EWWYYTGHLE DAEGGRYGFE LTFFKRRIDN DKPWGIPVGW IDDTALMAHF SVTCEETAEF 
VQDGRTWFSN KNIYARTDRY EVAYKDWKAG GDMERHTLTA RTKDTAIDLS ATPVKPPVLH 
GTDGIVPKGE NRANYYMSFT RLALAGTLVF KGKEIPVTGT AWFDHEFGYM GTTAVSGWDW 
FSLQMEDATE YMLYALRLKD GTIDPVSHAF RIDPEGKSEN LPLSDLDITV LSRWKSPHNG 
AVYPSAWRIV ADPWGLDVIV IPTVADQEFR YHDIVYWEGS CGVYGEPANG RAYVELVGYC 
PWKAMADLLE E