Gene Dole_2637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2637
Symbol
ID	5695488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3180786
End bp	3182087
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	53%
IMG OID	641265245
Product	HipA domain-containing protein
Protein accession	YP_001530517
Protein GI	158522647
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000320909
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAGCG ATGCGCGGGT CATGCTCTGG GGATCAGATA TTGGCGCCGT GACCTGGCTG 
GAAGACCGGG AAATCGGTGT ATTTCAATTT GAGCCCGGTT TCCTGGAAAG TGGCATTCAA 
TTATCACCGT TGATGATGCC CCTTCGCGCT GCCCCGTATG AATTTCCGGC ACTGGCCAGG 
CATACATTTA AAGGGCTCCC CGGATTGCTG GCGGATTCTC TGCCCGATAA ATTCGGAAAT 
GCGATCATTG ATGCATGGCT CGCTGAAACG GGCAGGAATG TGATGGATTT CCATGCCGTA 
GATCGCCTGT GTTACATCGG CAGGCGCGGT ATGGGGGCGC TGGAATTTGA GCCGGCAATT 
CATGAACTGT CAACAGAACA GCAAAATCTC GAAGTGGACA AGCTGGTAGC ACTGGTGAAC 
AAGGTGCTGG ATGAACGTGC TGCAATGGGG GGCGCATTTA CGGGTGAGGA TGACCGAAAA 
GTCATCGAAG ACATTCTTCG CGTCGGGACC TCGGCAGGCG GCGCCCGGGC AAAAGCAATC 
CTGGCCTGGA ATCCGCGGAC CAATGAATTT TGCTCCGGCC AGGTCGATGT CGAAAAAGGC 
TTCGAGTACT GGCTGATGAA ATTTGACGGC ATCGCCAACA ATCGCGACAA CGAACTCGCC 
GACCCGCAAG GCTACGGCAG AATCGAATAT GCCTATTATT TGATGGCTGT CGATTGCGGC 
ATCGAAATGA CTGACTGCAG GCTTCACCAC GAAGGGGGCC GAAGCCACTT TATGACCAGG 
CGTTTCGACC GCACCGGAAA AGGCGGCAAA GTCCATATGC AGTCACTGGG GGCCATGGCC 
CACTACGACT ATAAACAGCC GGCCCGATAC GCATACGAGC AGGCCATTTA CGTGATGAAA 
CGGCTGAACC TTTCGCAAAA GGAACTCAAT CAACAGGTGC TGCGGACGTT TTTTAATGTC 
ATTGCCCGCA ACCAGGATGA TCATGTGAAA AACATCGCTT TTCTGATGGA CCGGCAGGGC 
CGGTGGCGGC TTTCCCCGGC TTTTGATGTC TGCTATTCCT ATAATCCGAC CGGCGATTGG 
ACAAACCGGC ATCAGATGAG CGTCAACGGC AAGCGGGATA AATTTGTGCG GGACGATTTA 
ATTGCCTTTG CCGGTGTTGC CGGCATCAAG AAGAAGAAGG CAAACGAGAT GATTGACCAT 
GTCCTGGACA GTGTCAGGAA ATGGCCGGAG TTTGCGGAAC AGGCGGAACT CAGCAAAGAG 
CGTATGGTAA AAATTAAAAA CAGCCACAGG CTGACCTTAT AG

Protein sequence

MISDARVMLW GSDIGAVTWL EDREIGVFQF EPGFLESGIQ LSPLMMPLRA APYEFPALAR 
HTFKGLPGLL ADSLPDKFGN AIIDAWLAET GRNVMDFHAV DRLCYIGRRG MGALEFEPAI 
HELSTEQQNL EVDKLVALVN KVLDERAAMG GAFTGEDDRK VIEDILRVGT SAGGARAKAI 
LAWNPRTNEF CSGQVDVEKG FEYWLMKFDG IANNRDNELA DPQGYGRIEY AYYLMAVDCG 
IEMTDCRLHH EGGRSHFMTR RFDRTGKGGK VHMQSLGAMA HYDYKQPARY AYEQAIYVMK 
RLNLSQKELN QQVLRTFFNV IARNQDDHVK NIAFLMDRQG RWRLSPAFDV CYSYNPTGDW 
TNRHQMSVNG KRDKFVRDDL IAFAGVAGIK KKKANEMIDH VLDSVRKWPE FAEQAELSKE 
RMVKIKNSHR LTL