Gene Haur_4613 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4613
Symbol
ID	5736460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5899069
End bp	5900472
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	51%
IMG OID	641281777
Product	type II secretion system protein E
Protein accession	YP_001547372
Protein GI	159901125
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCTCC TAAAGCGTAT TGCAGGAAAT ACGTCCCCAT CCTCGGCTTC CGAACCTACA 
GCAGCAGCAC AATCGAGTGC TGCTGCCACA CGCCCTGATG GAGCTATTCC GCGCTCTGCT 
TCAGTTTCTG CCCAAGATCG CCTACTTGAT GTTCGACATC GTGTCCAGCG ACGTTTGACT 
GAAGAAGTTC GCGATGTTAA TAGCACAAGT GAAACCAAAA TCCGCCAAAC GGTCGAAGAT 
CTCTTGAGTG TCGTCCTTGA TAGCGAAAAT ATCGTGTTAA GTCGGGTCGA ACGCCAACAA 
TTGGTCGAAT CGTTGATGTC GGATATCGTT GGGCTTGGGC CGCTCGATTC GCTGCTCAAA 
GATGAGAGCA TCTCGGAAAT TATGGTCAAT GGGCCAAACA AAATCTATAT CGAACAACGT 
GGGAAGCTGA CGCTTTCTGG CACAACATTT ATCGATGATG AACACGCGAT GCGGGTGTTG 
TATCGGATTG TGTCGCCTCT TGGCCGCCGG ATCGATGAAA GCTCGCCCAT GGTCGATGCC 
CGGCTTCAAG ATGGCTCGCG GGTTAACGCA GTTATTCGGC CTATTTCATT GATTGGTCCA 
GTCATCACGA TTCGGAAATT CTCCAAAAAG CCGCTTGGCC CCGAAGATCT GATTCGGTTT 
GGGGCGATTA GTCGCGAAAT GATGGAGTTT CTTTCGGCCA GCGTTCGTGC TCGGATCAAT 
GTGGTGGTTT CTGGTGGTAC CGGTTCGGGC AAAACGACCT TATTGAATGT GCTTTCCTCA 
TTTATCCCTG AAGATGAACG TTTGATTACG GTTGAAAACG CTGCCGAACT TCAGCTCCAA 
CAGGATCACG TGATTTCGCT CGAATCGCGG ACGGCCAATA TCGAAGGTAA GGGCGAAATT 
TCAATCAACG ATTTGATTAT CAACTGCCTG CGGATGCGAC CTGAACGCAT TATCGTCGGC 
GAATGTCGCG GTGGCGAGAC CTTGGCTATG TTGCAAGCAA TGAATACTGG CCACGAAGGC 
TCGATGACCA CCCTACACGC CAATACCCCG CGTGACGCGA TTGCCCGGAT TGAAACTATG 
TGTTTGATGT CGGGGATGGA TTTGCCGCTC AAGGCTATCC GTGAACAAGT TGCCTCGGCG 
ATTGAGCTGA TTGTGCAACA AGCCCGACTT AAAGATGGTT CGCGGCGGGT TATGGCCATC 
TCCGAAGTAA CCGGAATGGA AGGCGATTTG GTGGTGCTCC AAGATATTTT CATCTTTGAG 
CAAACTGGCC TCGATGAACG TGGTAAGATT GTAGGGTCGC TCCGGCCAAC CGGGGTTCGG 
CCACGCTTCC TTGATCGGTT TGAAGCCTTG AATATTTACC TGCCACCGAA CGTCTTTGGC 
AATAGTTCAG AGCGCTTTTA CTAA

Protein sequence

MSLLKRIAGN TSPSSASEPT AAAQSSAAAT RPDGAIPRSA SVSAQDRLLD VRHRVQRRLT 
EEVRDVNSTS ETKIRQTVED LLSVVLDSEN IVLSRVERQQ LVESLMSDIV GLGPLDSLLK 
DESISEIMVN GPNKIYIEQR GKLTLSGTTF IDDEHAMRVL YRIVSPLGRR IDESSPMVDA 
RLQDGSRVNA VIRPISLIGP VITIRKFSKK PLGPEDLIRF GAISREMMEF LSASVRARIN 
VVVSGGTGSG KTTLLNVLSS FIPEDERLIT VENAAELQLQ QDHVISLESR TANIEGKGEI 
SINDLIINCL RMRPERIIVG ECRGGETLAM LQAMNTGHEG SMTTLHANTP RDAIARIETM 
CLMSGMDLPL KAIREQVASA IELIVQQARL KDGSRRVMAI SEVTGMEGDL VVLQDIFIFE 
QTGLDERGKI VGSLRPTGVR PRFLDRFEAL NIYLPPNVFG NSSERFY