Gene Huta_2539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2539
Symbol
ID	8384844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	2605293
End bp	2606417
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	644973616
Product	Citrate (Si)-synthase
Protein accession	YP_003131436
Protein GI	257053603
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.64966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACG AGGAGATACA CCGCGGACTG GCGGACGTGA CGGTCACCGA AACGCGGCTG 
AGCGACATCG ACGGCGAGGC CGGCCAGCTG TGGATCGCGG GGTACCCAGT CGCAGACCTG 
GCGGCGAACG CGACCTACCC CGAGACAGTC TATCTGCTGT TGCACGATCG CCTGCCGGAC 
GCCGAGGAAC TGCAATCCTT CGAGGATCGG CTGTGTTCGT ACCGGACGCT GCCGGAACCC 
TGCCACGATG CCGTCGTCGC GGCCGCCCAG CGCGGGGCCG GGCCGATGGC CGCCCTCCGG 
ATGGGCGCGG CGACAGCCAC GGCGGTCGAG CCGAACGATC CCGAGGCCGA CGCCCTCCGG 
TTGATCGCCC GGCTGCCGAC GATCACGGCG ACCTACTGGC GCGTGCTCCA GGGCCAGGAA 
CCGCTCGAAC CACGGCTCGA TCTCGGCCAC GCCGCCAACT ATCTCTACAT GCTGACCGGC 
GAGGAGCCGA CCGATGCCCA GGTCGCGGGC CTGGAGACGT ACCTCTCTAC CGTCGTCGAT 
CACGGCCTCA ACGCTTCGAC GTTCACCGCG CGAACGATCG TCTCGACGGA GTCCGAGCTG 
GTCTCGGCGA TCACCGGGGC GATCGGCGCG CTGCGGGGGG ACCTCCACGG CGGTGCGCCG 
GACCTGGTTC TGGAGATGCT CGAATCGCTA GAGGAGAGCG AGGATGTCCG CGGCGAACTC 
GGGGCGCGGC TCGAAGCCGG GGAACGACTG ATGGGCTTTG GCCACCGGGT GTACGGCGCG 
CGCGACCCGC GAGCGGCAGT CTTAGAGGAC GCCGCCGCGT CATTTTACGA GGGTGAGGAC 
GATTTCTTCG CCGCGGCCAA AGCAATCGAG GACGTCGCGA CCGACCTCCT GGCCGAGCAC 
CGCCCCGACC TGGACCTGGA GACGAACGTC GAGTTCTACA CCGCCGTCCT GCTCCACGGT 
GTCGGGATTC CGCCGGAACT GTTCACGCCG ACGTTCGCGA TCTCGCGGGT CGCCGGCTGG 
AGCGCGCACT GTCTCGAACA ACTCGAGGAC AACCGGCTGA TCCGCCCGCG GAGCGAATTC 
GTCGGCGAGC ACGACCGCGG GTGGGTGCCG CTCGACGAGC GATAA

Protein sequence

MSDEEIHRGL ADVTVTETRL SDIDGEAGQL WIAGYPVADL AANATYPETV YLLLHDRLPD 
AEELQSFEDR LCSYRTLPEP CHDAVVAAAQ RGAGPMAALR MGAATATAVE PNDPEADALR 
LIARLPTITA TYWRVLQGQE PLEPRLDLGH AANYLYMLTG EEPTDAQVAG LETYLSTVVD 
HGLNASTFTA RTIVSTESEL VSAITGAIGA LRGDLHGGAP DLVLEMLESL EESEDVRGEL 
GARLEAGERL MGFGHRVYGA RDPRAAVLED AAASFYEGED DFFAAAKAIE DVATDLLAEH 
RPDLDLETNV EFYTAVLLHG VGIPPELFTP TFAISRVAGW SAHCLEQLED NRLIRPRSEF 
VGEHDRGWVP LDER