Gene Hhal_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2021
Symbol
ID	4710382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2224301
End bp	2225491
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	77%
IMG OID	639856494
Product	type II secretion system protein
Protein accession	YP_001003587
Protein GI	121998800
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.159835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCCGCC TGAGCTGGCG GGGCCTCGAC GCTGGCGGAC GGCGCCTCTC CGGCACCTGC 
CACGCCGACT CGCCAAGCGC CGTACATCAC GCCCTGGCCG AACAGGGCGT GGCGGTGACC 
GCCGTCCGGC GGGAGCTATG GCGACCGCGC CGGCGGCAGC CGGGCAGCGC CCGACGCGCC 
GCCATCCTGC GCCGGCTGGC CTCGGTCCTG GAGGCTGGGG CGCCGCTGAG CGAGGCGCTG 
CGGGTCACCG CGGCCCAGGC CCCGGACGCC GCCCTGCGCA ACGGTCTGCG CGGGGTGCGC 
TACGCGGTCG AGCGCGGCAC CGACCTGGCC ACCGCCTTCG GCACTGAGTT CCCCGGTCTG 
CGCCCGGCCC ACCGCGCCCT CCTGGCGGCC GGCACCTGGA CCGGCGACCT GCCCGCGGCC 
CTGGGCAGTG TCGCCGCCGA GATCGAGCGC GAGGCGGCCA TCGTCGCTCA GCTGCGCCGC 
GCCCTGACCT ACCCGGCGGT GGTCGCCGGC GCCGCCCTGA CCCTGATCGC CCTGCTGCTG 
ACCGCCGTGG TCCCGCGTTT CGCCGGGCTG TTCGAGCAGA GCGGTGAGCC GCTGCCCGCC 
CCGACGCGGG CCGTCCTGGC TGCTTCGGAG GGGTTCGCCG TGGTGGCGCC GGCGACCCTG 
CTCCTCGGTC TGGTCACCGG CATCGGGCTG ACGGCGGCCC TGCGCCGTCG CCCCGCCTGG 
CGCCGGCACG CCGCCGCCGG GCTGGCCCGG ATGCCGTGGC TTGGCACTCT GCTCCTGGAG 
GCCGCCCTCA GTCGCTGGTC GGCCACCCTG GCACGCCTGC ACGGGGCCGG GGTGCCCCTG 
CTCGACGCCC TGCCCCGCGC CGCGGAGGCG GCCCGCGGGG CCGACCTGGA GCCGCGACTG 
GCCCACCTCG GCCAGCGCAT TGGCGCCGGC GAATCCCTGG CCGAGGCCCT GCGAAAGAGC 
CTCCCCGAGT CCCGGGAGAT CAGCCAGCTG GTCGCCATCG GCGAGCGCAG CGGGCGGCTC 
GAGGAGCTGC TCCACGAGGC CGCTACGCTG CATCAGCAAC GCCTCGAGGC CCGCTTGCAG 
CGCGCCGGCG CGCTGCTCGA GCCGGCCCTG ATCCTGCTCC TCGGGGCGAT CACTGCCGGG 
GTGGTCGCGG CCCTCTACCT GCCCGTCTTC CGCATGGGCG CGACACTCTA A

Protein sequence

MARLSWRGLD AGGRRLSGTC HADSPSAVHH ALAEQGVAVT AVRRELWRPR RRQPGSARRA 
AILRRLASVL EAGAPLSEAL RVTAAQAPDA ALRNGLRGVR YAVERGTDLA TAFGTEFPGL 
RPAHRALLAA GTWTGDLPAA LGSVAAEIER EAAIVAQLRR ALTYPAVVAG AALTLIALLL 
TAVVPRFAGL FEQSGEPLPA PTRAVLAASE GFAVVAPATL LLGLVTGIGL TAALRRRPAW 
RRHAAAGLAR MPWLGTLLLE AALSRWSATL ARLHGAGVPL LDALPRAAEA ARGADLEPRL 
AHLGQRIGAG ESLAEALRKS LPESREISQL VAIGERSGRL EELLHEAATL HQQRLEARLQ 
RAGALLEPAL ILLLGAITAG VVAALYLPVF RMGATL