Gene Hhal_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1804
Symbol
ID	4711015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1975979
End bp	1977193
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	71%
IMG OID	639856274
Product	tryptophan synthase subunit beta
Protein accession	YP_001003370
Protein GI	121998583
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.603761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACCTG AGCAGGACGG CGGCGGCCCC GCCGAGGAGC ATGATGGGCA CTTCGGCCGG 
TTCGGGGGGC GGTTCGTCTC CGAGACCCTG GTCGGGCCGC TCGAGGAGTT GACCGAGGCG 
TACGCCGAGG CGCGCCGCGA CCCGGGTTTC CAGGCCGAGC TCGATCGCGA GTTGCGGGAT 
TTCGTCGGTC GGCCCACTCC GCTGTACCTG GCCGAGCGGC TGACCGCCCG CGCCGGCGGT 
GCACGCATCT ACTTCAAGCG CGAGGATCTG GCCCATACCG GCGCGCACAA GGTCAACAAT 
ACCGTGGGGC AGGCGGTGCT GGCCGCGCGC ATGGGCAAGA CGCGGATCAT CGCCGAGACC 
GGGGCGGGGC AGCACGGCGT GGCTACGGCA ACCGTCGCGG CACGCATGGG GCTGGAGTGC 
GTCGTTTACA TGGGGGCCGA CGACGTGCAG CGCCAGGCCG CCAACGTCTA CCGGATGCGT 
CTGCTCGGCG CTGAGGTCCG CGCCGTGGAC GCCGGGACGC GCACCCTCAA GGACGCCATG 
AACGAGGCGA TGCGCGACTG GGTGGCGAAT ATCGACAACA CCTTCTACAT CATCGGCACC 
GTCGCCGGTC CCCATCCCTA CCCGACGCTG GTTCGCGACC TGCAGCGGGT CATCGGTGTC 
GAGACCCGAG CGCAGATCCT GGAGCGCGAG GGGCGCTTGC CCGACGCCGT GGTCGCCTGC 
GTCGGCGGCG GTTCCAACGC CCTGGGGATC TTCCATCCGT TCCTGGATGA CGCCGATATC 
CGGCTCGTCG GGGTCGAGGC CGGGGGCGAG GGCCTGGCCT CCGGCCGGCA CGCCGCCCCG 
CTCAACGCCG GCCGCCCCGG TGTGCTCCAC GGTGCGCGCA GTTACCTGAT GGAGTCCGAC 
GAGGGGCAGA TCATCGGTAC GCATTCGATC TCCGCCGGGC TCGATTACCC CGGCGTCGGC 
CCTGAGCACG CGTGGCTGAA GGATTCCGGG CGCGCCGAGT ATGTGACGGT CACCGACGCC 
GAGGCCCTGG CCGCTTTCCA CCGGCTCAGC CGCACCGAAG GCATCCTGCC GGCGCTGGAG 
ACCTCCCACG CCGTCGCCCA CGCGGAACGC CTGGCCGCGG AACTCGGCCC GGACGCTGCG 
CTGGTGGTCA ATCTCTCCGG GCGGGGCGAT AAGGACATCG CCACGGTCGC GGCGCAGGAG 
GGCATCGAGC TGTGA

Protein sequence

MRPEQDGGGP AEEHDGHFGR FGGRFVSETL VGPLEELTEA YAEARRDPGF QAELDRELRD 
FVGRPTPLYL AERLTARAGG ARIYFKREDL AHTGAHKVNN TVGQAVLAAR MGKTRIIAET 
GAGQHGVATA TVAARMGLEC VVYMGADDVQ RQAANVYRMR LLGAEVRAVD AGTRTLKDAM 
NEAMRDWVAN IDNTFYIIGT VAGPHPYPTL VRDLQRVIGV ETRAQILERE GRLPDAVVAC 
VGGGSNALGI FHPFLDDADI RLVGVEAGGE GLASGRHAAP LNAGRPGVLH GARSYLMESD 
EGQIIGTHSI SAGLDYPGVG PEHAWLKDSG RAEYVTVTDA EALAAFHRLS RTEGILPALE 
TSHAVAHAER LAAELGPDAA LVVNLSGRGD KDIATVAAQE GIEL