Gene Hhal_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2201
Symbol
ID	4709549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2415278
End bp	2416375
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	63%
IMG OID	639856676
Product	hypothetical protein
Protein accession	YP_001003767
Protein GI	121998980
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000750597
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAGCTGA TTCGTAGCTG GCTGCGACGC ACATTCAACG ACCCTCAGAT CGCTGCCTTC 
ATCGTCTTGA TGGTGGTGGG CCTCGGGGCG CTGCTGATGC TCGGCAGCAT TCTCGCCCCG 
GTGATCGCCG CCGTGGTGAT CGCCTACTTG CTCGAAGGGG TGGTGAGGGG TTTCGAACGC 
GCCGGGGTGC CCCGGATGCT GGCGGTGGTG ATCGTCATCC TGTTCCTCAC CACCTTCCTG 
GTCCTGGTGC TCTTTGCGCT GATCCCGTTG CTCTACCGCC AGGTGGGCCA GCTGGTGGAT 
CAGCTGCCGG CGATCCTCGC CCAGGGGCAG ATGCTGCTGC TGCAGTTGCC CGAGCATTAC 
CCGCAGCTCT TCTCCGAGGC GCAGATCCGC GAGATGCTCG ATACCGCCCG GCGGGAGATC 
ACCGACCTGG GGCAGCGGGT GGTGGCCTCG GTGACGGTTC AGTCGCTGAT GATCCTCGGC 
ACGCTGGTGA TCTACGCGGT GCTGGTGCCA TTTTTGGTCT TCTTCCTGCT CAAGGACAAA 
CGGCTGTTGC TGCAGTGGGT CAGCAACCAT ATGCCCCGCC ACCGTGCCTT TGCCTCGGAG 
GTGTGGCTGG ACGTCGATCA GCAGATCGGC AACTACGTCC GCGGCAAGTT CATCGAGATC 
CTGATCGTCT GGGCGGTCAC GTACATCACC TTCTCCCTGT TGGGGGTGCC GTTTGCCATG 
CTGCTCGCGG TGGCCACCGG CTTGTCGGTG ATCATCCCCT ATGTCGGGGC CTTCGTGATG 
ACCGTGCCGG TGGCGCTGAT CGCCTACTTC CACTTCGGGG TGAGCCAGGA GCTGGTCTAC 
GTCCTGGTGG CCTACACCAT CATCCAGGTG CTCGACGGCA ACGTCCTGGT GCCGCTGCTC 
TTCTCCGAGG TGGTGAACCT CCACCCGGTG GCGATCATCG TCTCGATCCT GGTCTTCGGC 
GGGATCTGGG GATTCTGGGG GATCTTCTTC GCCATCCCGT TGGCCACCTT TATCCAGGCG 
ATCATCAAGG CGTGGGTGCG GCGCCGCAAG CCGCCGGATG ACGAATCCGC AGGGGTCGAG 
GAGGAGCTGG TCCCCTGA

Protein sequence

MELIRSWLRR TFNDPQIAAF IVLMVVGLGA LLMLGSILAP VIAAVVIAYL LEGVVRGFER 
AGVPRMLAVV IVILFLTTFL VLVLFALIPL LYRQVGQLVD QLPAILAQGQ MLLLQLPEHY 
PQLFSEAQIR EMLDTARREI TDLGQRVVAS VTVQSLMILG TLVIYAVLVP FLVFFLLKDK 
RLLLQWVSNH MPRHRAFASE VWLDVDQQIG NYVRGKFIEI LIVWAVTYIT FSLLGVPFAM 
LLAVATGLSV IIPYVGAFVM TVPVALIAYF HFGVSQELVY VLVAYTIIQV LDGNVLVPLL 
FSEVVNLHPV AIIVSILVFG GIWGFWGIFF AIPLATFIQA IIKAWVRRRK PPDDESAGVE 
EELVP