Gene Hhal_1053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1053
Symbol
ID	4709815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1138008
End bp	1139258
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	639855524
Product	phosphate transporter
Protein accession	YP_001002631
Protein GI	121997844
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0306] Phosphate/sulphate permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.036629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATACG CGGTCGTCTA CCTGTTCCTC GCCGCTGCGT TTGGCTTGTT TATGGCGTGG 
GGCATCGGCG CCAACGACGT AGCCAATGCC ATGGCCACCT CGGTGGGCTC GCGGGCGCTG 
ACCATCCGCC AGGCGGTGGT GATCGCCGCC ATCTTCGAGT TCGCCGGTGC GGTGCTCGCC 
GGTGGCGCGG TGGCCGCCAC CGTGCGTGGC GGGATCGTCG ACACCTCGTC CCTGGTCGGC 
GAGGAGGAGA TCCTCGTCTT CGGCATGCTG GCCGCCCTTG CCGCTGCCGG CTGCTGGCTG 
CTGGTGGCGT CCTGGCGGGG GTGGCCGGTA TCCACCACGC ACTCGATCAT CGGCGCTCTG 
GTGGGCTTCG GCATCGCCGG GCTCGGCTGG GGCGCCATCC ACTGGCCGGC CGTCGGGCAG 
GTGGCAGCCA GCTGGGTGAC CTCGCCGCTG ATCGCCGCAG TCGTCAGTTT CGCACTGTTC 
CGCTCCGTGC AGGTGCTGGT GCTCGACCGC CGCCACCCCC TTGAGGCGGC CAAGAAGTGG 
GTGCCATTCT ATATCTTCCT CACTGGCTTC TTTGTCTCCG TGATCACCCT CTTCCGGGGG 
CTGCAGCACA TCGGGCTGGA CCTGGGCTTC ACCACCAATC TGTCGCTGTC CCTGGGTATT 
GGCCTGGCCA TGGCGTGGGC CGGCAAGGTG GCCATCCACC GCACCCGGTT CGATGAGCGC 
CCACACCGGC GCTACCAGTT CCGCAACGTC GAGCGGGTCT TCGCCGTGCT GATGATCATC 
ACCGCCTGCG CCATGGCCTT CGCCCATGGC TCCAACGACG TAGCCAACGC CGTCGGCCCG 
GTCGCCGCGG TGGTGGCCAC GGTGACCAGC GGCGAGATCC AGGCCGAGGC GCCGGTACCC 
ATCTGGATCC TGGTCCTGGG CGCCGTGGGC ATCGTCGCCG GCCTGCTCAT GCTCGGCCGC 
CACGTCATCG CCACCGTCGG CAAGAACATC ACGCAGTTGA CCCCAAGCCG CGGGTTCGCC 
TGCAACCTGG CCACCGCCGG GACCGTGGTC ACCGCCTCGG GCATCGGCCT GCCTATCTCC 
ACCACCCACA CGCTGGTGGG GGCCGTGCTC GGCGTCGGCC TGGCCCGCGG TCTCGCCGCC 
ATCGACCTGC GGGTGGTGAC CGGAGTGTTC ATGTCGTGGC TGGTCACCCT GCCCGCCGGC 
GGCATCCTGG CCGTCATCTT CTTCTATCTG CTCTACTGGA GCTTCGGCTA A

Protein sequence

MEYAVVYLFL AAAFGLFMAW GIGANDVANA MATSVGSRAL TIRQAVVIAA IFEFAGAVLA 
GGAVAATVRG GIVDTSSLVG EEEILVFGML AALAAAGCWL LVASWRGWPV STTHSIIGAL 
VGFGIAGLGW GAIHWPAVGQ VAASWVTSPL IAAVVSFALF RSVQVLVLDR RHPLEAAKKW 
VPFYIFLTGF FVSVITLFRG LQHIGLDLGF TTNLSLSLGI GLAMAWAGKV AIHRTRFDER 
PHRRYQFRNV ERVFAVLMII TACAMAFAHG SNDVANAVGP VAAVVATVTS GEIQAEAPVP 
IWILVLGAVG IVAGLLMLGR HVIATVGKNI TQLTPSRGFA CNLATAGTVV TASGIGLPIS 
TTHTLVGAVL GVGLARGLAA IDLRVVTGVF MSWLVTLPAG GILAVIFFYL LYWSFG