Gene Hhal_1150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1150
Symbol
ID	4710140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1250925
End bp	1252103
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	64%
IMG OID	639855624
Product	hypothetical protein
Protein accession	YP_001002728
Protein GI	121997941
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.732796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAACT ACGCCGATAT GCTCCTCAGG CACGAGGAGA GCAGCGGCTT TATCAAGGCT 
CGCAGGGCCC CTCTGGGGTT TACCGACGGC CGTGATGAGG CGTGGTTACG TGACCTTTTG 
GCCGACAACC CGGATGTTCT GCCGATCGAG GAGATCGACC CGTCCTTTGC GCCGTTAGCC 
CCCCTCTGCA CCGAGCTTGA GACCGAGGCG GGTCCGGTAG ACGCCGCCTT TATCAATCCC 
TCCGGCCGGC TGACCCTGGT GGAGTGCAAG CTCTGGCGCA ACCCGGAAGC GCGGCGAAAG 
GTGATCGCGC AGATCCTCGA TTACGCCCGG GCGATTGCCC AATGGGACTA TGCCGACCTC 
CAGCGCCGGG TGGCCTCCGC CTCCGGAGAC AAGGCGAATC GACCGTTTGA GGCCGCCCGG 
CAGCTGCAAA CGGACCTGGA CGAGGCCGTC TTCGTCGATG CAACGGCCCG CGCCCTGCGA 
GAGGGGCGAT TCCTGTTGCT GATCGCAGGG GATGGTATCC GTGAAGGGGT CAGCGGGATG 
ACCGACCTGA TCAGCCGCAA TGCGGCCCTT GGCTTCAGCT TTGGCCTCGT CGAGGTCGCC 
CTGTATCAGT TCGGCGAACA GGGGCTCGCG GTCCAGCCGC GTGTCATCGC CAAGACCCAC 
ACGATCGAGC GAACCTTTGT GGTCATGCAA GGTCCCAATG GCGCCGTCCT TCAAGAGGGT 
GAGGGCGACG CGGACCAACC GTCGCAATCG CGCCCTACCG AGGACGAGGT GGCTTGGTGG 
GAGCCGTTAA CCCGAATCGC CTTCAATGAC CCCGAGCAGG AGCCACCGGT CTACCGCCCA 
CGCAACCACG TGAGGGTCGC CATGCCGTCA ACCGGGATGT GGGTGACGGC GTTTCGTGCC 
ATGAGCCATG GCATCTGCGG CGTATTTCTG GGCGGTAGGA AGCCCGAGCG CCTCGAGGTG 
CTCGACGCCC TGAACGAGGA GCGCGAGCAG ATCCTAAGCG AACTCCCTGA GGGGACGCAC 
CAGGGCATGG ACGGCACTGA AGAGCGCCCC GGATTTGCCA TCTACGCCCA GCTCGACGAC 
TTCGCCAGCG ACGAGGCGTG CCGCGCCTGG CTGTCGGAGC AGCTTAATCG GTTCGTGAAT 
GCGTTTCGTC CGCGGCTCAA GCGTGTGGAG AAACGCTGA

Protein sequence

MPNYADMLLR HEESSGFIKA RRAPLGFTDG RDEAWLRDLL ADNPDVLPIE EIDPSFAPLA 
PLCTELETEA GPVDAAFINP SGRLTLVECK LWRNPEARRK VIAQILDYAR AIAQWDYADL 
QRRVASASGD KANRPFEAAR QLQTDLDEAV FVDATARALR EGRFLLLIAG DGIREGVSGM 
TDLISRNAAL GFSFGLVEVA LYQFGEQGLA VQPRVIAKTH TIERTFVVMQ GPNGAVLQEG 
EGDADQPSQS RPTEDEVAWW EPLTRIAFND PEQEPPVYRP RNHVRVAMPS TGMWVTAFRA 
MSHGICGVFL GGRKPERLEV LDALNEEREQ ILSELPEGTH QGMDGTEERP GFAIYAQLDD 
FASDEACRAW LSEQLNRFVN AFRPRLKRVE KR