Gene Haur_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0234
Symbol
ID	5732129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	269886
End bp	271043
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	51%
IMG OID	641277358
Product	glycosyl transferase group 1
Protein accession	YP_001543014
Protein GI	159896767
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCTATA ATGTGCTCAG CAATTATTTG AGCGCGAGTA TCACCCTAGC AATGCATATT 
CTTCATGTCT ATAAAGATTA TTTTCCAGTG CTTGGTGGCA TGGAAAACCA TATTCGGGTA 
GTGGCTGAGG GCTTGGCTGA ACGCGGCCAT CAAGTTACGG TGGCAGTCAG CAATACCTAC 
CCAAAAACCG AAATCGAGCG CCGTAATGGT GTAGCGATTA TTAAAGCAGC CCAATGGTTG 
CGCAAGGCAT CAACCCCGAT TAGCCCGATG AGTTTGCCAT TAAGTTGGCG TGTACCCGCC 
GATATTATCC ATTTGCATCA TCCCTTCCCA CCTGGCGATT TGCTGTATTG GCTGCGTGGT 
GGCAAGGCTA AATTGGTGAT TACTTATCAA AGCGATATTG TGCGCCAACG CCGTTTGTTG 
CAACTCTATC GACCATTGCT TACCCGTACT TTGAACGCCG CCGATCGAAT TATCGCGGCC 
AGCCCGCAGT ATATCCAAAC CTCGCCATGG TTGGCTCCTC ATGCCGCCAA ATGCCGCGTA 
ATTCCCTTGA GCGTCGATAC CGAGCGCTTC AATCAACTTG ATCATGCGGC GATTCAGGCG 
TTGCGTGAGC AGGTTGCAGC ACCCATGGTG TTGTTTGTTG GGCGCTTCCG CCATTACAAA 
GGCCTGCACT TTTTGCTCGA AGCCTTGCCA AAAATTCCCA AGGCCAAATT GGTGTTGGTC 
GGCATTGGCC CTGAGGAAGC TCGTTTGCGC GAGTTGGCGC AACGCTTGGG TGTTGGCGAA 
CGTATTATAT GGGCTGGCGA AGTCCCGGAT CAAGCCTTAC CAAATTACTA TGCCGCTGCC 
GATGTATTTG TGCTACCATC TCATTTACGA GCAGAAGCAT TTGGCATCGT GCAACTCGAA 
GCATTAGCCG CTGGAATTCC AATTGTCAGC ACTGAGTTGG GCACTGGCAC AAGTTTTGTC 
AACGCCCACG GCCAAACTGG GTTTGTTGTG CCACCAGCCG ATCCGGCGGC ACTGGCGCGG 
GCAATCACTG TGCTGTTGGA AAATCCAGGC TTGCGGGCGC AATTTGGAGC TAACGGTCGT 
CAACGCGCGA GCAGCACGTT CAGTCCACAG CGCATGCTCG ATCAGATTGA AGAACTTTAT 
CGTGAGATTG TGAGTTAG

Protein sequence

MFYNVLSNYL SASITLAMHI LHVYKDYFPV LGGMENHIRV VAEGLAERGH QVTVAVSNTY 
PKTEIERRNG VAIIKAAQWL RKASTPISPM SLPLSWRVPA DIIHLHHPFP PGDLLYWLRG 
GKAKLVITYQ SDIVRQRRLL QLYRPLLTRT LNAADRIIAA SPQYIQTSPW LAPHAAKCRV 
IPLSVDTERF NQLDHAAIQA LREQVAAPMV LFVGRFRHYK GLHFLLEALP KIPKAKLVLV 
GIGPEEARLR ELAQRLGVGE RIIWAGEVPD QALPNYYAAA DVFVLPSHLR AEAFGIVQLE 
ALAAGIPIVS TELGTGTSFV NAHGQTGFVV PPADPAALAR AITVLLENPG LRAQFGANGR 
QRASSTFSPQ RMLDQIEELY REIVS