Gene Dole_3253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3253
Symbol
ID	5696116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3898834
End bp	3899964
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	61%
IMG OID	641265873
Product	hypothetical protein
Protein accession	YP_001531133
Protein GI	158523263
COG category
COG ID
TIGRFAM ID	[TIGR01451] conserved repeat domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00034855
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAACA GAAAACGTAC AACCAGCAGA TGGATCAAGG GTGCGGGTGT TCTGGTCGCG 
GCAGTTATGC TGCTGTGGGC GGCCCCGCAG GGAGCCCTGG CGGACGGCAC CGCATCGGGC 
ACTCCCGTTA CCAACCTTGC CACCGTGGCT TACCAGGTGG GCGGTGTGGA CCAGACCGTC 
ATTGAAAGTT CGCTCACGGG CAACTCCACA CCGGGCATCG GCAACGGCAC GGCCACCTCT 
TTTGTGGTGG ACACCAGCCT TGACCTGAGC GTGGCCTGGA CGGATCTGGC TGACGTTGAA 
GTGGTACCCG GTCAGTTGGA CCAGGTACTG ATCTTCACGG TCACCAACGA CGGCAACGCC 
ACCCAGGATT TTTCCCTGTC CGCGGTCAAC AGGGCCGCGG GGGACGATTT TGACACCACG 
GGCGTGACGA TCTTTGTAGA GAGCGGCGCC ACCGCCGGCT ATCAGGCGGG TGAAGATACC 
GCCGACTACA TCGATGAGCT GGCTGCCGAT GCTTCCAAAA TCGTTTACAT TGTCTCTGAC 
ATTCCGGCAG CCACAGTCAA CGGTAATGAC GCCATCCTTG ACCTGGTGGC CCAGGTGGCC 
GTGGGCGGCA CTGCTGCCAC CCAGGGCGCG AACATCACCA CCGACGACAG CCTCATTGCC 
GATAACCCGG CAACGGTTCA GACCGTTTTT GTCGACGGTG CCGGCACGGC CGACGTGGCC 
GAGGACGGCA AGGCTTCCGA TGCCGGTACT TACACGGTTG TCACCGCGGC CCTGGAAGTA 
ACCAAGAGCG TCACGGTGAT CAGCGATCCG GTCAACGGCA CCACCAACCC CAAGGCCATT 
CCCGGCGCGG TCATCGAGTA TGAGATCGAA ATCGAAAACA CGGGCAGTTC CAATGCCACC 
AGCGTCACCA TCACCGACTC GATTCCTGCC AATACCGATT TTATCATCGG CAGCGTGGCC 
GGAGACGGGG ACACGATAAG CTACTCGGAT GACCTTGGCG CCACATGGAC CTACTCCCCG 
TCCGGCTCCA ACGGCGATCC GGATCCGGAT GTGGACGCCG TCCAGATCGT CTTTAACGCG 
ATCAACAGCA GCGCTACCGA GTCAGCCACC TTCCGGGTGG AAGTCGAATA G

Protein sequence

MRNRKRTTSR WIKGAGVLVA AVMLLWAAPQ GALADGTASG TPVTNLATVA YQVGGVDQTV 
IESSLTGNST PGIGNGTATS FVVDTSLDLS VAWTDLADVE VVPGQLDQVL IFTVTNDGNA 
TQDFSLSAVN RAAGDDFDTT GVTIFVESGA TAGYQAGEDT ADYIDELAAD ASKIVYIVSD 
IPAATVNGND AILDLVAQVA VGGTAATQGA NITTDDSLIA DNPATVQTVF VDGAGTADVA 
EDGKASDAGT YTVVTAALEV TKSVTVISDP VNGTTNPKAI PGAVIEYEIE IENTGSSNAT 
SVTITDSIPA NTDFIIGSVA GDGDTISYSD DLGATWTYSP SGSNGDPDPD VDAVQIVFNA 
INSSATESAT FRVEVE