Gene Haur_0214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0214
Symbol
ID	5732109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	248414
End bp	249409
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	47%
IMG OID	641277338
Product	periplasmic component of the Tol biopolymer transport system-like
Protein accession	YP_001542994
Protein GI	159896747
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAC TTTTTATGTT TACAGCTTTT TTATTAATAG CTAGTGGATG TACTATGCAA 
ACACCTATGA CTCAGATCCC AACTACACCG ATTACACCAA CCCAATTAGC CGTCCCTGCG 
GGAATTTATT CAGGGCTAGC TTGGCTTGAT CAAGGTCTAG TGCTACAAGC ACGAACAGCC 
AACAATCCTG TTGAGAATTT GTATTGGATT GATCAACAAG GAAACCTTGG TGAATCATTA 
TCAATTCCAC TTGAACAAGC ATTTGTTATG ACTTCATATT ATTTCCCCCA ACGCCTTCCT 
AATGGCAAAC TTGGCCTGCG GCGCTATAAC TGGAATCCAA ATCTTGAGAC GGGCATTTCC 
GAACGTGAGT TTGGTGTATG GCAATTCGAT CCAACAACCA ATGATCTTAC CCCACTTTTA 
CAACCTGCTT TACCCCAAGA TCTCAGCCAA CATCTGCGGT TTAGCCTTGC TCCTGATATG 
CAACGCGCGA TGCTCTCCGA TGGCGGCTAT CTTCAGTCAC GGCTCTTTTG GTGGTCGGCG 
GAGGCAGGTC ATCAACCGCT TGATGCAGGG GTGGCTATCT GTCAATACTT TGCATGGTCA 
CCCGATGGTA CGACCATTGC CTATGCTGGT TCACCGCATG CAGCCGATTC CATGGCAACC 
TTAGGTGGAG TGCGCTCAAC ACTCTATTTG ATGGATAGTG ATGGTGGGAA TCGGCGCGAA 
ATCGGCACGA ATATTCGCAA TGTTTCAGGG TTGCAATGGT CGCCCGATGG TCAATGGCTG 
GTCGTTCTGG GCTACTTCGA TGGATTCGAT AATCAGGTCT GGTTGGTAAA TCCTACGAAA 
GCTGAGTGGC ATCAACTCAC GACTACGGTT GGAAATTATC AATGGCCTGC ATGGTCACCC 
GATGGCAAGC AGATCGCCGT CATTTGGCGT AAACCAGCTG ATCTTGGCCC CAGTGATTAT 
GTGATGACGT TGGATGTTTC AGCGTTTATG CAATAA

Protein sequence

MKQLFMFTAF LLIASGCTMQ TPMTQIPTTP ITPTQLAVPA GIYSGLAWLD QGLVLQARTA 
NNPVENLYWI DQQGNLGESL SIPLEQAFVM TSYYFPQRLP NGKLGLRRYN WNPNLETGIS 
EREFGVWQFD PTTNDLTPLL QPALPQDLSQ HLRFSLAPDM QRAMLSDGGY LQSRLFWWSA 
EAGHQPLDAG VAICQYFAWS PDGTTIAYAG SPHAADSMAT LGGVRSTLYL MDSDGGNRRE 
IGTNIRNVSG LQWSPDGQWL VVLGYFDGFD NQVWLVNPTK AEWHQLTTTV GNYQWPAWSP 
DGKQIAVIWR KPADLGPSDY VMTLDVSAFM Q