Gene Hhal_1692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1692
Symbol
ID	4710036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1846822
End bp	1848102
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	65%
IMG OID	639856159
Product	hypothetical protein
Protein accession	YP_001003258
Protein GI	121998471
COG category	[S] Function unknown
COG ID	[COG2718] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTCAATA TCATCGACCG GCGCCGCAAT CCGAAGGGCA AGAGCCTGGC CAACCGCCAG 
CGTTTTCTCC GGCGTGCCAA GCGCCAGGTT CTCGATGCAG TCAACGAGGC CTCCGGCCGG 
CGCAAGGTGA CCGACGTGGC CGGCGGGGAG CAGATCACGA TCCCCGCCGA CGGGCTCCAC 
GAGCCGAGCT TTCGCAAGGC GCCCGATCGC GGGGTGCGTG AGCACGTGGT CCCTGGTAAC 
AAGGAGTACG TGGTCGGCGA TACCATCTCG CGCCCCGAGG GGCAGGGGGG TAGCGGGGGG 
CGCGAGGGTA GCCCCGATGG CGAGGGGGAG GACGAGTTCA CCTTCGCCGT CAGTCGCGAC 
GAGTTCCTCG ATCTCTTCTT CGAGGGGCTG GAGTTGCCGG ATCTGGTCAA GCGCCAGGTG 
AAGAAGACCG AGCAGTACAC CCAGCAGCGG GCAGGGTACT CGGTCAGCGG CTCCCCTTCG 
AACCTCAACG TCGAGCGGAC CATGCGCAAT TCCCTGTCGC GGCGCATCGC CCTGCGTCGG 
CCGAAGGGGG AGGACCTGCA GGCACTGGAT GAGGAGATCG ACCGCCTGGA GCGTTCCGGA 
GCTGAGCCCG AGCGGCTGCG TGAGCTCATC GAGCTACGCC GGAACAAGCA GGAGCGGTCC 
CGGGCCATCC CGTACATCGA TCCGGTGGAT ATCCGTTACA ACCGCTTCGA CCACGTCCCG 
CAGCCGATCT CCCAGGCGGT CATGTTCTGC CTGATGGACG TCTCGGGCTC CATGACTGAA 
GAGATGAAGG ATCTGGCCAA ACGGTTCTTC ATGCTCCTCT ACCTCTTCCT CGAACGCCGC 
TATCGGCATG TGGATATCGT CTTTATCCGC CACACCCATA TCGCCCAGGA GGTTGACGAG 
GACACCTTCT TCTACTCCCG CGAGACCGGT GGGACGCTGG TCTCCCCGGC GCTGGCGATG 
ATGCGCGACA TCGTTGACGA TCGTTATCCG GTCCAGGACT GGAATATCTA CGGAGCGCAG 
GCCTCGGACG GCGACAACAC CCCGGCGGAC AATCCGGCCA CCACGCGGTT GATGGCCGAC 
GGCATCCTCC CGCTGTGCCA GTACTTTGCC TACATCGAGG TGGGGGGTGG GCAAGCCTTC 
CACGTGCCGT CCGATTTGTG GCGAGCCTAC GATCGCTTGG CTCGGGGGGA GTCGCCCCTG 
GCCATGCGGC GGGTACAGAC CCGTGGCGAC ATCTTCCCGG TCTTCCGGGA TCTCTTTACG 
CCGGCTGAGC TGAAGGCCTG A

Protein sequence

MVNIIDRRRN PKGKSLANRQ RFLRRAKRQV LDAVNEASGR RKVTDVAGGE QITIPADGLH 
EPSFRKAPDR GVREHVVPGN KEYVVGDTIS RPEGQGGSGG REGSPDGEGE DEFTFAVSRD 
EFLDLFFEGL ELPDLVKRQV KKTEQYTQQR AGYSVSGSPS NLNVERTMRN SLSRRIALRR 
PKGEDLQALD EEIDRLERSG AEPERLRELI ELRRNKQERS RAIPYIDPVD IRYNRFDHVP 
QPISQAVMFC LMDVSGSMTE EMKDLAKRFF MLLYLFLERR YRHVDIVFIR HTHIAQEVDE 
DTFFYSRETG GTLVSPALAM MRDIVDDRYP VQDWNIYGAQ ASDGDNTPAD NPATTRLMAD 
GILPLCQYFA YIEVGGGQAF HVPSDLWRAY DRLARGESPL AMRRVQTRGD IFPVFRDLFT 
PAELKA