Gene Hhal_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1041
Symbol
ID	4709793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1124353
End bp	1125537
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	70%
IMG OID	639855512
Product	phosphoglycerate kinase
Protein accession	YP_001002619
Protein GI	121997832
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGCGA AGCGCATGAC CGATCTGGAC CTGACGGGCA AGCGGGTGCT CATCCGCGAG 
GATCTGAACG TGCCGATCAA GGACGGCCAG GTTGCCGACG ACACCCGCGT GCGCGCTGCC 
GCCGAGAGCA TCCGCCAGGC CATGCAGGCC GGTGGCCGGG TGCTGGTGAT GTCCCACCTG 
GGGCGGCCCA AAGAGGGCGA GTACGACGCC GAGGCCTCGA TGGCCCCGGT GGCCCGCCGC 
CTGGGCGAGA TTCTCGGCTG TGAGGTGCCG GTGGTGCGTG ACTGGCTGGA GGGCGTGGAT 
GTCCCCGAGG GCGGGGTCGC GCTGGCGGAG AACGTGCGTT TCCAGCCCGG CGAGACCAAG 
GACGACGAGG CCCTGTCCCG GCGTATGGCA GCGCTCTGTG ACGTCTTCGT CATGGACGCC 
TTCGGCACTG CGCACCGGGC CCAGGCCTCC ACCCACGGTG TGGCCCGCTT CGCCCCCGAG 
GCCTGTGCAG GCCCGCTGCT CAGTGCCGAG CTGGAGGCCT TGGGCAAGGC TCTGGATAAC 
CCGGCCCGGC CGATGATCGC CATCGTTGGC GGTTCCAAGG TCTCCGGCAA GGTCCAGGTC 
CTGGAGGCGC TCACCCACAA AGTCGATCAG CTCATCGTCG GCGGCGGGAT TGCGAACACC 
TTCATCGCCG CGGCGGGCTA CTCTGTGGGC AAGTCCCTCT ACGAGGCCGA CTTCGTCGAC 
ACCGCCAAGC GTCTGATGGA AGAGGCGCGG GCCAAGGGCG GCGAGATCCC GATCCCCGAG 
GACGTGGTCA CGGCCAGGGA TTTCTCGGCG GACGCCGAGG CCCACGTCCA TCCGGTGGAC 
GCCGTGCCCG ACGACGAGAT GATCCTCGAC GTTGGGCCGC AGACCCGGGC CCGCTACGAC 
GGCATGTTGC GCAACGCCGG TACGGTGGTC TGGAACGGGC CGGTGGGGGT CTTCGAGATG 
GCGCCCTTTG CCGGCGGCAC CCGGGCGCTG GCCGAGGCCA TTGCCGCCAG TGACGGTTTC 
TCCATTGCTG GTGGCGGGGA CACGCTGGCC GCGGTGGAGC AGTTCGGCAT CACCGACCAG 
GTCTCGTACA TCTCCACCGG CGGTGGCGCC TTCCTGGAGT TCCTCGAGGG GCGCGTTCTG 
CCCGGCGTTG CGGCCCTGGA GCAGCACGCG GCAGCGCACT CGTGA

Protein sequence

MKAKRMTDLD LTGKRVLIRE DLNVPIKDGQ VADDTRVRAA AESIRQAMQA GGRVLVMSHL 
GRPKEGEYDA EASMAPVARR LGEILGCEVP VVRDWLEGVD VPEGGVALAE NVRFQPGETK 
DDEALSRRMA ALCDVFVMDA FGTAHRAQAS THGVARFAPE ACAGPLLSAE LEALGKALDN 
PARPMIAIVG GSKVSGKVQV LEALTHKVDQ LIVGGGIANT FIAAAGYSVG KSLYEADFVD 
TAKRLMEEAR AKGGEIPIPE DVVTARDFSA DAEAHVHPVD AVPDDEMILD VGPQTRARYD 
GMLRNAGTVV WNGPVGVFEM APFAGGTRAL AEAIAASDGF SIAGGGDTLA AVEQFGITDQ 
VSYISTGGGA FLEFLEGRVL PGVAALEQHA AAHS