Gene Hhal_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1990
Symbol
ID	4710321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2195295
End bp	2196791
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	70%
IMG OID	639856463
Product	TolC family type I secretion outer membrane protein
Protein accession	YP_001003556
Protein GI	121998769
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01844] type I secretion outer membrane protein, TolC family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAG GCAACGAGAG ACTGCAGTTC AGGCTCGCCC CCCGGGTCAC CGGCTGGACC 
CTGGCCGCCC TGCTGGCGCT GCCCGGGGCC ACCGGTGCCG GGGACGAGGA CAACGACGAT 
CGCGACGACG CCGAGGCGGT GGTCGACGCC CCGGTGCCAG TGGAGGACGA AGAGGACGCC 
CTGGCCCCGG CAGAGATTGA GGAGCGGACT CCGCAGCAGG ACCTGCTGGA CATCTACCGC 
CTGGCGGTGG AGGCCGACCG CAGCCTGTCC GCCGCGCTCA ACCGGCGCCG CGCCGCCGAC 
GAGCAGATCG CCCAGGCCCG CTCGCAGTTC CTGCCGCAGA TCAATGCAAC AGCAAAGTAC 
GAAGACATCG ATTCAGAGAC CGACTGGGAT GGGGGTGCCA CCGTGGACGG CGACACCTCG 
GGGTGGCAGG CGACCCTCTC TTTAACCCAG CCGATCTTCC GGCGCGGCAA CTTCATCGAC 
CTGGAGCGGG CGCGGACCGC CGTGGACCGG GCCGGGATCG AACTCGCCGT GGCCGAGCAG 
GGGCTGGTGG TGGACGTCAC CGAGGCGTAC TTCGACGTGC TCCTGGCCCA GGACGAGCAG 
GCCCTGGTCG AGGCCGAGCT AGCTGCCGTT GAGAGTCAGC TTCGCCGCGC CGAGCGGGCC 
CTGGAGGTGG GCACCGGCAC CCAGACCGAC GTCGACGAGG CCCGGGCCAC CTTCGACCGG 
GTGCGCGCCG AGCGGGTGGC GGTGGACAAC CAGGTGGAGG TCGCCAAGCA GGCCCTGCGC 
CGACTCACCG GCGAACTGCC CGGGGAGCTG GCCGGCCTCG GCGAGGCGTT CGAGCCGCAG 
CCGGTGGAAC CTGCCGACAC CGACCACTGG GTAGACCTGG CCCAGCGCTA CAACCTGGAG 
GTTCAGCTCG CCGAGCGGGA CGACCAGCTG GCCCGCCACG ACGTCGAGGG GCAGCGCGCC 
GATCGCTGGC CGGAGGTTGA CCTGGAAGCC TCTTTACGAC GAGAAGATGG CGAAAGCCTT 
AACCAGCAAG CAATGACGAG CATGGACCGT CAGATAGACA CCCGCTCCAT CCGCCTGCAG 
GTCTCCGTGC CGCTTTACAC CGGCGGCGCC ATCTCCAGCC GGGTCCGTGA GGCCGAGGCC 
GAACGCACCG CAGCCAGCGA CGACCTGGCC GACCAGCGCC GGGCCAGTGC CCTGGACGCC 
CGCTCCGCCT TCCTCGGCCT GACCTCGGAG CTGGAACGGG TCCGGGCCCT GGAGCAGGCC 
CTGGTCTCGG CGCGCAGCAA CGAGGCGTCG GTGCGTCGCG GGCAAGAGGT GGGCACCCGC 
ACCACCACCG ACGTCCTCGA CGCCCAGAGC CAGCGCTTCG AGACCAAGCG CGACCTGGCT 
GCAGCGCGTT ATGATTACCT GCTGAACTTT GTGCAGTTGC AGGCGTCCGC CGGACTGGCG 
GTGGATGAGA CGGTCATCCG CGAGATCAAC GAGCAGCTGC AGTCGGTCTC TCGATAA

Protein sequence

MKRGNERLQF RLAPRVTGWT LAALLALPGA TGAGDEDNDD RDDAEAVVDA PVPVEDEEDA 
LAPAEIEERT PQQDLLDIYR LAVEADRSLS AALNRRRAAD EQIAQARSQF LPQINATAKY 
EDIDSETDWD GGATVDGDTS GWQATLSLTQ PIFRRGNFID LERARTAVDR AGIELAVAEQ 
GLVVDVTEAY FDVLLAQDEQ ALVEAELAAV ESQLRRAERA LEVGTGTQTD VDEARATFDR 
VRAERVAVDN QVEVAKQALR RLTGELPGEL AGLGEAFEPQ PVEPADTDHW VDLAQRYNLE 
VQLAERDDQL ARHDVEGQRA DRWPEVDLEA SLRREDGESL NQQAMTSMDR QIDTRSIRLQ 
VSVPLYTGGA ISSRVREAEA ERTAASDDLA DQRRASALDA RSAFLGLTSE LERVRALEQA 
LVSARSNEAS VRRGQEVGTR TTTDVLDAQS QRFETKRDLA AARYDYLLNF VQLQASAGLA 
VDETVIREIN EQLQSVSR