Gene Hhal_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0236
Symbol
ID	4709927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	270988
End bp	272064
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	59%
IMG OID	639854696
Product	hypothetical protein
Protein accession	YP_001001832
Protein GI	121997045
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000273252
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAACA AGACCAAGAG CCTGGTCCTC TCCGGGGCGG CGGTCGCCCT GGCCACGCCG 
ATGTCCTCGG CGCTGGCGCT GGACGACGTC CTGAGCTTCG GGGCGTGGGT GAACTACAAC 
TACAACGTTG ATGACGACGC CAGCGAGGAC CGCTTCGGCG ATCTCGACTT CGAGTCCTTC 
AACATCTACG CCAACCACGA GCACGGCGAC TGGTTCCTCG ACTCGGAAGT CCGGTTGGGT 
AAGGGCAGTT TCCAGGGTTC CGGCATCAGC GAGCAAGGAT CTGAAGCCAC AGCAGACCGC 
AATGTCATCG GCATTAAGGA ACTGGCCATC GGCCGCCACT ACGGCGAAGA GTGGACCATG 
ACCATTGGTA AGACCACGGT CCCGTTCACC TACAGCCGTT TTAACTTCTG GCCGGGCGCC 
CGCAACATGG CCGGCTTCGA CGACCAGGAC GGGGTCGGTA TCCGGTTCGA TAACGACCCG 
GTCAACACCC CGTTCGACAT GAGCCTCATG TTCGTCAAGA GCCAGAACTT CGGCAACGAG 
ACCACCTCGC TTGACGACGG GCAGCGGACT TTCTGGGGAA CCGATGACAC TTACCACGTC 
ATGAACACCC TGGTGGGTGA CTTCGGTTTC ACCACGGGTG ATTTCCGCCA CGGTGTCTCG 
GTGCAGGCAG GTCAGCTGGC CGACCAAGAT GATACCGACG AGATCGAGGG CCACTACGCG 
GCCGGTCTGT ACTCCGAGGG CACCGTTGGC GCCCTGGACC TCTCCGCGCA GTTCGTGCAC 
TACGACCTCG ACGAAGTCGA TGGCGACGTA ACTCAAGGCT CCGGCCAGAA AGCCATGGTC 
AACGTGGGCA CCGACGTAGG CAGCTGGTAC ACCTACAGCG ACCTCTCCAT GAGTATGCCC 
GACAGCGATA TAGCAGATGA TGACCAGATC GACCTGGTCC TTGGTGGTCG CTACAACTAC 
GGCCCGGGTA ACATCTACGT CGAGGTGCTG CTTGAAAACC TCACCGATGA TGAAGATGTC 
GAGACGAACG ATGAGTTCTC TCAGAGCATC GACCTGACCA TGGACTACTA CTTCTAA

Protein sequence

MNNKTKSLVL SGAAVALATP MSSALALDDV LSFGAWVNYN YNVDDDASED RFGDLDFESF 
NIYANHEHGD WFLDSEVRLG KGSFQGSGIS EQGSEATADR NVIGIKELAI GRHYGEEWTM 
TIGKTTVPFT YSRFNFWPGA RNMAGFDDQD GVGIRFDNDP VNTPFDMSLM FVKSQNFGNE 
TTSLDDGQRT FWGTDDTYHV MNTLVGDFGF TTGDFRHGVS VQAGQLADQD DTDEIEGHYA 
AGLYSEGTVG ALDLSAQFVH YDLDEVDGDV TQGSGQKAMV NVGTDVGSWY TYSDLSMSMP 
DSDIADDDQI DLVLGGRYNY GPGNIYVEVL LENLTDDEDV ETNDEFSQSI DLTMDYYF