Gene Dole_0026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0026
Symbol
ID	5692840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	27261
End bp	28541
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	57%
IMG OID	641262602
Product	citrate synthase I
Protein accession	YP_001527913
Protein GI	158520043
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000469449
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAA CCGCCACTAT TGTAATTAAT GGAAAAACAT ATGAATTCCC GGTAATTACC 
GGAACAGAAG GCGAAAAGGC CATCGACATT CGGGAGCTTC GGGCCAAAAC CGGCTACATC 
ACCTTTGACC CGGGTTTCAG CAACAGCGGC AGCTGCACCA GCACCATCAC CTACATGGAC 
GGCGCCAAGG GGGTCCTGCG TTACAGGGGG TATCCTATTG AACAACTCGC CGAGACAAGC 
TGTTTTGTGG AGGTGTGTTA CCTGCTGTTA AACGGAGACC TGCCCTCCCG GGCCGAATAC 
CAGCGCATGA GCGTCATGCT CAACGACCAC TCCCTGGTCC ATGAGGACAT GCAGATCTTT 
TTCCAGAATT TTCCCCGGTC GGCAAACCCC ATGGGCATTC TCTCCTCCAT GGTCAACGCC 
CTGCGCAGCT TTTATCCCGA ACTGATGACC ACGGAAGAGG CCATAGAGAC CACCTTTCTG 
CGGCTGATCT CCAAGGTGCG CACCATGGCG GCCATGTCCC ACCGGATCTC CCGTGGTCAC 
AAGATCGTCT ATCCCCGGCC CGACTACTCC TACTGCGCCA ATTTTCTGAA CATGATGCAC 
GACTCCCCGG TGCGGCCCTA TGAGATCAAA AAGGAGTTTG TGGAGGCGTT GAACATGTTC 
TGGGTGTTGC ATGCCGACCA TGAGCAGAAC TGCTCCACCT CAACGGTGCG GGCCGTGGGC 
AGCGCCCGGG CCAATATCTA CGCGGCCCTG TCCGCCGGTA TCGCGGCCCT GTGGGGCCCC 
CTGCACGGCG GCGCCAACCG GGCCGTTGTG GAGATGTTCG AAGATATCCG CAAGAGCGGC 
GGGGACGTGA AAAAGGCGGT CAAGCGGGCC AAGGACAAGA ACGATCCGTT CCGGCTGATG 
GGGTTTGGCC ACAGCGTCTA CAAGACCTAT GATCCACGGG CCAAGATCAT GAAAAAAATG 
TGCGACAAGG TGCTGGCCGT GGCCAACACA GAGGACCCCC TGCTGGATAT CGCCATGGAA 
CTGGAGGAGG TGGCCTTAAA GGACAGTTAC TTTACGGACC ACAACCTCTA TCCCAACATC 
GATTTTTACA GCGGCATCGT GCTGCGGACC CTTGGCATTC CGGTGGAGAT GTTTACCGTG 
ATGTTTGCCA TCGGCCGGCT GCCGGGATGG ATCGCCCAGT GGAAAGAGCT GATGGACGAT 
CCGTTCAAGA AGCTTTTCCG GCCCCGCCAG ATTTACGTGG GCGAAACCAT GCGGGAAGTG 
CTTCCCATCG ACGAACGGTA G

Protein sequence

MTETATIVIN GKTYEFPVIT GTEGEKAIDI RELRAKTGYI TFDPGFSNSG SCTSTITYMD 
GAKGVLRYRG YPIEQLAETS CFVEVCYLLL NGDLPSRAEY QRMSVMLNDH SLVHEDMQIF 
FQNFPRSANP MGILSSMVNA LRSFYPELMT TEEAIETTFL RLISKVRTMA AMSHRISRGH 
KIVYPRPDYS YCANFLNMMH DSPVRPYEIK KEFVEALNMF WVLHADHEQN CSTSTVRAVG 
SARANIYAAL SAGIAALWGP LHGGANRAVV EMFEDIRKSG GDVKKAVKRA KDKNDPFRLM 
GFGHSVYKTY DPRAKIMKKM CDKVLAVANT EDPLLDIAME LEEVALKDSY FTDHNLYPNI 
DFYSGIVLRT LGIPVEMFTV MFAIGRLPGW IAQWKELMDD PFKKLFRPRQ IYVGETMREV 
LPIDER