Gene Hhal_2050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2050
Symbol
ID	4710014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2253282
End bp	2254412
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	639856523
Product	porin
Protein accession	YP_001003616
Protein GI	121998829
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.946286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAC AACTGATCAC CCTGGCGACG GCCACCGCCA TGACCGCGCC CGCCGCCGTG 
CTGGCCGACA GCCACGACAG CCACAGCCCG GAGATCTACG GCCAGGTGCA CATGTCGATG 
AACCACATCG ACAACGACGA CACCGAGGGT GAGGACAGCG CCCTGAACAT CTCCTCCAAC 
TCCTCCCGCT TCGGCATCCG CGGCTCCGAG GAGATCCAGC CGGGGCTCAC CGGCATCTAC 
CAGCTGGAGC TCGGCGTCCA CTGGGGCGGC CAAGGGTCAG ACAAGACCTC TACGACCGGG 
GATGACTCCA TCTGGCGCCA GGTCCGCGAC AGCTACGTCG GCCTTGAGGG CGACTTCGGT 
ACCCTCCGTG CCGGCCGCCT CCCGGCTGCC AACCAGTACA TCTACGACGC CAACTTCTTC 
ATCAACACCA TCGGCGATCC CGGCGGGCTG ACCGGCTTCG ACATTGCTGG GAATGCGGGC 
ATCGGGGGCC GCTACTCCAG TGCGGTGCAG TACACCGCCC CGATGGTCGG CCCGCTCGGC 
GCCAGCGTCA CCGTCGCCCC GTCGAACAAC GGCGCTGACG AGCACTCGAT GATCCTGCGC 
GGCACCTACG AGGAGGGGCC GTTCTTTGGT GCCGTCAACT ACATCAGCAA GCCGGATGCG 
ACGGTCGAAG ATCCAGAGGA CGATGATATT ACGTCGCAGC ACGACCTCCA GTTCCTGGTG 
CTGAGCGGCG GCTACGAGCA GAACGGGCTG CGGGTGGCCG GCCTCTACGG CCTGGTGCTC 
GACGACGACG ACCTGACGGA CGGCGCGCCG GAAATCGACG GTGAGGACAG CTTCTTCTCC 
CTCGGCGCCT CCTTCGACAT CACCGCCCAG GGCACGGTCA AGGGTCAGTA CACGGCGTAC 
ATGGCCGATG AGGGCAGTGA GGGCGATTCC AACCTGTTCG CCATCGGCTA CGACCACGCC 
CTGTCGGACC GGACCACCGC CTACGCCGTC TATGCGCACA TGGACAACGA TGAGATGGCG 
AGCCGCGGGG TAGACGGTTA CGGCCACGGC GGCGGTCCGG ACGATCTGGC TGGCCCGAAT 
AACGACGCCG ATCCCAACGC CTTCTCGGTG GGCGTGACCC ACAACTTCTA A

Protein sequence

MKKQLITLAT ATAMTAPAAV LADSHDSHSP EIYGQVHMSM NHIDNDDTEG EDSALNISSN 
SSRFGIRGSE EIQPGLTGIY QLELGVHWGG QGSDKTSTTG DDSIWRQVRD SYVGLEGDFG 
TLRAGRLPAA NQYIYDANFF INTIGDPGGL TGFDIAGNAG IGGRYSSAVQ YTAPMVGPLG 
ASVTVAPSNN GADEHSMILR GTYEEGPFFG AVNYISKPDA TVEDPEDDDI TSQHDLQFLV 
LSGGYEQNGL RVAGLYGLVL DDDDLTDGAP EIDGEDSFFS LGASFDITAQ GTVKGQYTAY 
MADEGSEGDS NLFAIGYDHA LSDRTTAYAV YAHMDNDEMA SRGVDGYGHG GGPDDLAGPN 
NDADPNAFSV GVTHNF