Gene Hhal_1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1947
Symbol
ID	4710761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2143899
End bp	2145080
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	639856420
Product	hypothetical protein
Protein accession	YP_001003513
Protein GI	121998726
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID	[TIGR03304] outer membrane insertion C-terminal signal

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.309501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGGA CATCGACCGT GGCGGCTGTG GCGGGACTGT TTGCATGGGG CGGTGCGGCG 
TCGGCGGCAC AGGCCGGCGA GGTCAGCCTT TATGGGCAGG TCCACGCCGG CCTGCACCAG 
TTCGCCTACG AGGACTCTTC CGACGTCACC AAATTCACGG ACCAGGGGCG GACGCGCTGG 
GGCGTTTCCG GGCAGCAGCC CCTGGACGAC GAGTGGACGG CCATCGGCCA ACTGGAGTGG 
AGCGCCAGCC CGCACCTGGG GGACGACGAT TTTAGTCGAC GGATCAGCTA CGTGGGAGTG 
GACAGCCCCT ACGGTGAGCT GGTCGTCGGC ACGGTCCACG CCGCCTACAA GACCCTCGGC 
GGCGTGCGCT GGGATCCGCT GGTGGCCACC GAGCTGCAGC AGCGGCGCAC CGGCGGGATG 
TCCGGCGGCT CCTTCGGCCA CAACGATTTC GTCAACCGCG CGGTGCAGTA CGTCAGCCCG 
GAGATGGCCG GGCTGCAGCT GCACGCCCAG ATCGGGGTGG AGGACGACAA CCAGGACCGG 
ACGCTGTCGA GCCCCGATCC GGGTGATGCG GATCAGGACC TGCAGCAGGG CGATGTCATC 
CTTGGTGCCA GCTACCTCGG CCTCCCTGAC TGGCACTTCA TCGCCGCGGT GATGCACCTC 
GACGAGCGGT TCACCGACGT GGATGACGTG GACGACGGCG ATACCAACTG GAAGGTGGGG 
GCCCGCTGGG CGCCGGATGC GTTCTCTCTG GCCTACCAGT ACGAGTCGGT GGAGATCATC 
CGCGGGCCCG GGGGCGCCGG CCGGATCGAC AACCTAGTGG GGGATCCCTC AAACCGGGTG 
GACGGCGAGA GTACAACGGA TGACGACCCA GCCTTCTACG ACGGCCGCTT CACCGACGCG 
GTGGACCACC ACGCGCTGAT CGGGACCTAC CAGCAGGGGC GCAACCAGTG GGTGCTCGCC 
CTCGGTCACG CCGACGCCGA TGGCGACGAC GAGGACGTCA GCTCGATCAC CGGCGCCGTG 
GTCCATCAGC CCCACGAGGA TTTCCGGGTG TACGCCGGCG TGCAGTACCA GTCCTTCGAC 
GATGCGATCG GTAGCGCCGG CGAGGATCCC GACGAGGCCG CCGACGATCA CCTGACCACC 
TACGCCATCG GCGCCCGGTA CGACTTCGGG GCGACGTTCT GA

Protein sequence

MRRTSTVAAV AGLFAWGGAA SAAQAGEVSL YGQVHAGLHQ FAYEDSSDVT KFTDQGRTRW 
GVSGQQPLDD EWTAIGQLEW SASPHLGDDD FSRRISYVGV DSPYGELVVG TVHAAYKTLG 
GVRWDPLVAT ELQQRRTGGM SGGSFGHNDF VNRAVQYVSP EMAGLQLHAQ IGVEDDNQDR 
TLSSPDPGDA DQDLQQGDVI LGASYLGLPD WHFIAAVMHL DERFTDVDDV DDGDTNWKVG 
ARWAPDAFSL AYQYESVEII RGPGGAGRID NLVGDPSNRV DGESTTDDDP AFYDGRFTDA 
VDHHALIGTY QQGRNQWVLA LGHADADGDD EDVSSITGAV VHQPHEDFRV YAGVQYQSFD 
DAIGSAGEDP DEAADDHLTT YAIGARYDFG ATF