Gene Hhal_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0467
Symbol
ID	4711546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	535421
End bp	536530
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	70%
IMG OID	639854926
Product	ribulose-bisphosphate carboxylase
Protein accession	YP_001002057
Protein GI	121997270
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTGCCG AAACCCTGCG CGTGACCTAC TACCTGACCT GCCGCCCCGG CGAAGATCCC 
CACGACAAGG CCAAGGGCAT CGCGCTCGAG CAGAGCGCCG AGCTGCCCTC GCGCTGCATC 
CCGGAGCACG TCTACGACGA CGTGGTGCCG ACGATCCAGG AGCTAACAGC GCTGGAGGAC 
GGCCGCCACC GCCTGGTTCT CGACTTCCCG GAGGCGATCA CCGGCCTCGA ACCGACCCAG 
CTGATCAACA ACCTGTTCGG CAATATCTCG CTCAAGAGCG GGATCCGCCT GGCCGACGTG 
GAGTGGACGC CCAACCTCCT GCGCGCCCTG GGCGGGCCGC GCTACGGGAC CGCCGGCGTA 
CGCGAGATGC TCGGCATCGG CGAGCGGCCG ATCAGCTCCA CGGCGCTCAA ACCCCTGGGC 
CTGGACACCG CCACGCTGGC GGGCTTCTGC GCCGACTTTG CCCGCGGCGG CATCGACCTG 
ATCAAAGACG ACCACGGGCT CTGCGACCAG GACACCTCCC GCTTCGTCGA TCGCGTGCAG 
GCCTGCCAGC GGGCGGTCAA CGAGGTCAAT GCCGAGACCG GCGGCCGCTC GCTCTACCTA 
CCCAATGTCA CCGGCCCCCG CTGGGAGCTG GACAAGCGCC TCGACGCCGC GCAGGAGGCC 
GGCTGCAAGG CGGTCCTCAT CTGCCCCTTC CTCACCGGTC TCGATGCGCT GATCTGGGCC 
CGCGAACGCT ACGACATGGC CCTGATGGCC CACCCGGCCT TCGCCGGCGC GGTGGCCGGC 
GCCGAGCACG GCATCGACCC CGCCCTGCTG CTCGGCGAGA TCACCCGCCT GTTCGGTGCG 
GATATGGTGG TCTACACCAA CGCCGAGGGG CGCTTCCCCA CTTACGATCA GGCGCTGTGC 
GACCGCATCA ACGACCGGCT GCGCCGCCCC CTGGGCGACA TCCGCCCGGC TCTGCCCACG 
CCGGGCGGCG GTGTGGACGC CGCACGCGCG CCGTATTGGG CCGAGCGCTA CGGGCCCGAC 
GTGGTACTGC TGATCGGTGG CAGCCTCTAC GCCCAGGGCG ATCGGGCCGC CGCCGCACGC 
CGTCTGCAGG ATGTGGTAGA GGGTCAGTAA

Protein sequence

MSAETLRVTY YLTCRPGEDP HDKAKGIALE QSAELPSRCI PEHVYDDVVP TIQELTALED 
GRHRLVLDFP EAITGLEPTQ LINNLFGNIS LKSGIRLADV EWTPNLLRAL GGPRYGTAGV 
REMLGIGERP ISSTALKPLG LDTATLAGFC ADFARGGIDL IKDDHGLCDQ DTSRFVDRVQ 
ACQRAVNEVN AETGGRSLYL PNVTGPRWEL DKRLDAAQEA GCKAVLICPF LTGLDALIWA 
RERYDMALMA HPAFAGAVAG AEHGIDPALL LGEITRLFGA DMVVYTNAEG RFPTYDQALC 
DRINDRLRRP LGDIRPALPT PGGGVDAARA PYWAERYGPD VVLLIGGSLY AQGDRAAAAR 
RLQDVVEGQ