Gene Hhal_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1997
Symbol
ID	4710424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2201556
End bp	2202710
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	68%
IMG OID	639856470
Product	hypothetical protein
Protein accession	YP_001003563
Protein GI	121998776
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.1616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACGTT GCATTGGCCT GGACATGGGG TACGGGTTCA TCAAGATCGA TGACGGCCGC 
GAGGGGCACG TATTCCCCAG CGTCGTCGGC GAGGGCGAAT CGGGCATGCC GATGTCCCTG 
GGCGTGGCCC AGCGCAGCGG CAGCAGCGAG CTTCGCATCA CCTACGGCGG CAAGAGCTAC 
CTGCTCGGCG ACTACGCCAT CCGCCACTCC CGCCTGGCGC ACCGGGGGCT GTCGCCCACC 
CGCGCCGAAG GGGACGACCT CAAGATCCTC TTCCTCGGTG CACTGAGCCT CTACGCCCGC 
GAGACCGTGA ACAACTTCCA CGTCGTCACC GGCCTGCCGC CGGGGCGCAT GCACATGGCC 
GACGACCTGG TCCGCCAGCT GCGCGGCGAC CATGAAGTCA TCCGCCACGT GGGCGCGAGC 
CGCTTCGGGG TAAGCATCCG CCTGGAGCAG ATTGAGGTGG TCCCGCAGCC GGTGGGCAGC 
TTCTGGGCCG AGGTGCTGGA TGATCGGGGG CAGATCCGTG GTGATCACCC GCTGCTCAAC 
GGCCGGGTCG GGATCATGGA CATCGGCTTC CGGACCAGCG ACTTCGCCAC GGTCATCGAT 
GGCGAGTACT CCCCGGGGTT CTGCAAGACG GTGCCGCTGG GCATCTCCTT CGGCTACGAG 
GAGATCGCCC AGGAGCTCTC TACCCAGTAC GGGCTCGAGC GCGAGCAGTA CACCCTGGAC 
GAGGCCATCA TCCAGGGGCA GGTGAACGTC AACGGCCGCC CGGTGGACAT CGTCGAGCTC 
CGCGATCGGA TCTTCGGCGA CATCGCCACC AAGCTGCTGG TCGAGGCGCG CTCGATGTGG 
CAGATCCAGG AGTACGACCA CATCATCATC ACCGGCGGCG GCGGCCGGGT GCTTGAGCGC 
TACCTGCGTC CGGAACTCTC CCAGGCCCAG CTGGCCCAGG ACTCCGTCAC CGCCAACGCC 
CGCGGCTATT TCAACTGGGC CTACTTCAAC GCCCAGCAGC GGGCCGCGGA GATGGGCCAC 
GCCACGGAAC AGAGTTCGGC AGAGGACTAC AGCTCCGGCA GCTACGGCAC CGGGAGCACC 
ACCTACAGCC GGGGGGGCGA CGACGGCCGA GACAGCGCCG CCGTGCCGCA GTCGCGCAGC 
GGCAGCGAGG GCTGA

Protein sequence

MERCIGLDMG YGFIKIDDGR EGHVFPSVVG EGESGMPMSL GVAQRSGSSE LRITYGGKSY 
LLGDYAIRHS RLAHRGLSPT RAEGDDLKIL FLGALSLYAR ETVNNFHVVT GLPPGRMHMA 
DDLVRQLRGD HEVIRHVGAS RFGVSIRLEQ IEVVPQPVGS FWAEVLDDRG QIRGDHPLLN 
GRVGIMDIGF RTSDFATVID GEYSPGFCKT VPLGISFGYE EIAQELSTQY GLEREQYTLD 
EAIIQGQVNV NGRPVDIVEL RDRIFGDIAT KLLVEARSMW QIQEYDHIII TGGGGRVLER 
YLRPELSQAQ LAQDSVTANA RGYFNWAYFN AQQRAAEMGH ATEQSSAEDY SSGSYGTGST 
TYSRGGDDGR DSAAVPQSRS GSEG