Gene Hhal_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1017
Symbol
ID	4709595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1088580
End bp	1090010
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	71%
IMG OID	639855488
Product	glutamate--cysteine ligase, GCS2
Protein accession	YP_001002595
Protein GI	121997808
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.22607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGACAGG AGATCGGTCG GGCACGGTTC GGGAGCGATG ACTTCAGCGC CTTTCGTCAG 
CGGCTCCGGG CGGAGACCCG ATTGCTGGGC GAGTGGTTGC GAGCCGGTCG GGTGGCCGAG 
GGCCCGCCGA GCATCGGCCT GGAGCTGGAG GCGTGGTTGG TGGACGCCGA CGGCCGTCCG 
GCCCCGATCA GTGATCGGGT GTTGAGCCGG GTCGAAGACC CTCGGGTTGA GAACGAGCTG 
GCCCGGTTTA ACCTGGAGAT CAACACCGAC GTTCACCCGC TGGCCGGAAC GCCCCTGCAG 
GGGCTGCAGA CGGAGCTCGC CGAGCGCTGG GCGCGGACGC AACGGGCCGC GGCCGACGCC 
GGGTGTCGGT TGGCACTGGT CGGCATCCTC CCTTCGGTGC GCGAGGCGGA TGTCTGCGTC 
GAGAACATGA CGCCCTCGCC CCGCTACGCG GCGTTGAACG AACAGGTCCT GGCGCTGCGC 
GGGCGTCGCC CGCTGACCCT CGACATCGAG GGGACGCAGC GCTTTCGCAC CGAGCGCCAC 
GACGTCATGC TCGAGGCGGC CACCACCTCC CTACAGCTGC ACCTGCAGGT GCCGCCGCAG 
CGCATGGCGG CATTCTTCAA CGCCGCGGTG GCGTTGTCGG CCGCTTCGGT GGCGGTGGCG 
GCCAATTCGC CGTTCCTGTT CGGTCGCCGC CTGTGGCACG AGAGCCGTAT CCCGCTGTTC 
GAACAGGCGG TGGCGTGCAC CCGCCTGGAG CCGCGTGGGG CCGGGACCCT GGCGCGGGTG 
GGCTTCGGCA GCGGCTACGC CCGCGACGCC CTGTACGGCT TCTTCGTCGA GAATCGGCAG 
CACCACCCGG TCTTGTTGCC CGAGTTGCAG GATCAACCGG TGGAGGCGCT GGCCCATCTG 
CGCCTGCACA ATGGGACCAT CTGGCGCTGG AACCGGCCGC TGGTGGAGGT GGTCGACGGG 
CAGTGCCAGC TGCGTCTGGA GCACCGGGTG ATGGCGGCCG GTCCGACCCT GGCCGACGTG 
CTGGCCAACG CCGCCTTCTT CTATGGCGCC GTGGCCGAGC TGGCTGAGTC GCGCCCGGGG 
CTGGTCGAGG AACTGCCTTT CCACATCGCC GAGCAGAACT TCTACGCCGC GGCCCGTTAC 
GGTCTGGAGG CCGAGGTCGA GTGGCTGGAT GGCTGGTTCG GCCGGCTGGG CGATCTCGTT 
ACCGAACGCC TGCTGCCCAA GGCCCGCCGC GGGCTGGTAC GGGCCGGGGT GGCGGAGGCG 
GAAGCCACGG CGCACCTGGG CGTGCTGGAG GAGCGGGTTG CCAGCGGTCG GACGGGCGCG 
GCCTGGCAGC TGGCCTGGGT GGAGCGCCAC GGTGAGGACG ACCAGGCGCT GACCCGGGCC 
TACCTGGATC GGGCCGCCGA CGGCGAGCCG GTCCACCGCT GGCCGCTGTA G

Protein sequence

MGQEIGRARF GSDDFSAFRQ RLRAETRLLG EWLRAGRVAE GPPSIGLELE AWLVDADGRP 
APISDRVLSR VEDPRVENEL ARFNLEINTD VHPLAGTPLQ GLQTELAERW ARTQRAAADA 
GCRLALVGIL PSVREADVCV ENMTPSPRYA ALNEQVLALR GRRPLTLDIE GTQRFRTERH 
DVMLEAATTS LQLHLQVPPQ RMAAFFNAAV ALSAASVAVA ANSPFLFGRR LWHESRIPLF 
EQAVACTRLE PRGAGTLARV GFGSGYARDA LYGFFVENRQ HHPVLLPELQ DQPVEALAHL 
RLHNGTIWRW NRPLVEVVDG QCQLRLEHRV MAAGPTLADV LANAAFFYGA VAELAESRPG 
LVEELPFHIA EQNFYAAARY GLEAEVEWLD GWFGRLGDLV TERLLPKARR GLVRAGVAEA 
EATAHLGVLE ERVASGRTGA AWQLAWVERH GEDDQALTRA YLDRAADGEP VHRWPL