Gene Dole_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2431
Symbol
ID	5695280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2937531
End bp	2938721
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	61%
IMG OID	641265038
Product	radical SAM domain-containing protein
Protein accession	YP_001530312
Protein GI	158522442
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1180] Pyruvate-formate lyase-activating enzyme
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAGA TCTCCCGGCG TGAATTTCTG GCCGCGGGTA TGACGGGCGC GGCCCTGCTC 
TGCTTTCCCG GCCCGTCGGC GGGGTTTGAC CTGTGGGGAA CAAAGACCCG CCGGGCCTCC 
GGCCCTTCTG ATATCACGGG GTCGGTGTTT AAAAACAGCG CGCCGGAAAC TCCCTGGAAA 
TGGTCTGTCG AAGCCTTTGA CTACGTAAAG CATGCCGACC GAAGCGTTAC CTGCGCCATC 
TGCCCCCATG AATGCCGGCT TTTACCGGGA GACCGGGGCC TGTGCCGCTC CAGGGTCAAT 
ATCGACGGGG TTCTCTACTC CCTGGTCTAC GGCAACCCCT GTTCAATCAA TGTGGACCCG 
GTGGAAAAAA AGCCGCTTTT CCATTTTCTG CCCCGGACCA CGGCCTTTTC CATTGCCGGG 
GCCGGGTGCA ACTTCCGGTG CCTCAACTGT CAGAACTGGG AGATCTCCCA GGCGACTCCG 
GAAACACTGC GCCACTACGA GCTCTTTCCC GACGGCGTGG TCCAGTCGGC CGGGCAGGCC 
GGCGCCGCGT CCATTGCCTA CACCTATTCG GAAGCGGTCA CCTTTTTTGA ATACATGTAC 
GACACCGCGC GCCTGGCCAG ACAACAAGGC ATCAAAAGCC TTCTGATCTC CAACGGGTAT 
ATCAGCAAAA ATCCGCTTTC GGCCCTGTGT GACGTCATCG ACGGGGCCAA CATTAACTTA 
AAATCCTTTG ACGACGCCCT CTACCGCAAA CTCAACGGCG GCCGGCTGGC CCCAGTGCTC 
GACACCCTTG AAACTCTGCA CCGGCGGGGG GTTCACCTGG AGGTCACCCA CCTGGTGGTG 
CCGGGCTATA CCGACGAGGA GTCCCTGTTC CGGCGGATGT GCGCATGGAT TGTCGAGGCC 
CTGGGGCCTG ATCACCCCCT TCACCTGCTT CGCTTTTTCC CCCAGTACCG GCTCAACCGC 
CTTGCCCCCA CCCCGGTGGA GGTCCTGACC CGGTTCCGAA ACCTTGCCAT GGCCGCCGGC 
ATCCGCTATG TTTACGTGGG CAACGTGCCG GACCATGAAG GGGTCCATAC CCGGTGCCCC 
AACTGTAACC GCGTGCTGAT TTTCCGCCAC GGGTACAACG TGACCCAGCC GGGCATAAAA 
AACGGCCGGT GCGCCGCGTG CGGCACCGCC ATACCCGGGG TGTGGGTTTG A

Protein sequence

MKQISRREFL AAGMTGAALL CFPGPSAGFD LWGTKTRRAS GPSDITGSVF KNSAPETPWK 
WSVEAFDYVK HADRSVTCAI CPHECRLLPG DRGLCRSRVN IDGVLYSLVY GNPCSINVDP 
VEKKPLFHFL PRTTAFSIAG AGCNFRCLNC QNWEISQATP ETLRHYELFP DGVVQSAGQA 
GAASIAYTYS EAVTFFEYMY DTARLARQQG IKSLLISNGY ISKNPLSALC DVIDGANINL 
KSFDDALYRK LNGGRLAPVL DTLETLHRRG VHLEVTHLVV PGYTDEESLF RRMCAWIVEA 
LGPDHPLHLL RFFPQYRLNR LAPTPVEVLT RFRNLAMAAG IRYVYVGNVP DHEGVHTRCP 
NCNRVLIFRH GYNVTQPGIK NGRCAACGTA IPGVWV