Gene Haur_3711 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3711
Symbol
ID	5735575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4667541
End bp	4668656
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	52%
IMG OID	641280863
Product	glycosyl transferase group 1
Protein accession	YP_001546475
Protein GI	159900228
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.102739
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAC CGCACACTGT ACTCTGTTTG ACAGCCTATC AACCAATGCT AACAGCCAGT 
GTGCGCTATC GAATTATGCC CTATGCTCCG GCTTTGGCAG CAGCAGGAAT TCAACTGCGT 
TATCTGCCCT TTGCCACGCC GCAACTTCAG CGCTTGCTCT ACCAACCCAA ACACTACCCG 
CAAAAAATCG TGGCGATGCT GAGCGCTTTG ACCCAATGGT TGGTTAAATT GCCGCGCCAG 
CCAGCCGCCG TAATTGTGCA ACGCGAGGCC GCCTTGATCG GCGCACCAAT GATTGAGCGT 
TGGTTTAGTC GGCGCGTACC AGTGATTTTT GATTTTGATG ATGCGATTTT TCTGCCAACC 
GATCCTAAGC GCAGTATCAA TGGCTGGCTG AGCCGTTTGG CCCGACCAGC CAATAAAACC 
GATCAACTAT TGAGCTTGAG CAGCATGGTT TGGGCGGGCA ATGCCTATTT GGCCGATTAT 
GCGCGGCGCT TCAATGCCAA TGTGCAGATT ATTCCGACTG TGGTTGATTG TGAACAGTGC 
CAGCCGCGAT CTGTGCCAAG CCCGCATATT TGCACGCTTG GCTGGATTGG CAGCCATTCG 
ACCGCCCGCT ATTTAGAGCA AATTGTGCCT GTGTTGCGCC AATTGGCGCA GCGCTATCGC 
TTTCGCTTGT TGGTGGTTGG TGCAGCCAAG CCGATTGAAA TTGAAGGCAT TGAATGTATC 
AATCACGATT GGCAGCAAGC CCGCGAATGG CATGATTTTC AGCAGATCGA CATTGGTTTA 
TACCCAATTG AAGCTGATTT ATGGGCCGAG GGCAAATGTG GCCTCAAGGC AATTCAATAT 
GGCGCGGCGG CAATTCCTAG CGTCTGTAGC GCTGTCGGAG TCAATCAACA TATTGTCGAG 
CATGGCCAAA CTGGATTTTT GGCGCATAAT TCGGCGGAAT GGCTTGATTA TTTGGCACGT 
TTGCTCGAAG ATGAGCAGTT GCGTCAAACG CTCGGCCAAG CCGCCCGTCA AAAAATCGAG 
GCCGAATACA GCGTGCAGCG CTATCAACCC ACGATTGTGG CAGCACTCAA GGATTATCTA 
TGTGTGGAAT CTGCGGAATC GTCAGTACAA GCTTAA

Protein sequence

MNQPHTVLCL TAYQPMLTAS VRYRIMPYAP ALAAAGIQLR YLPFATPQLQ RLLYQPKHYP 
QKIVAMLSAL TQWLVKLPRQ PAAVIVQREA ALIGAPMIER WFSRRVPVIF DFDDAIFLPT 
DPKRSINGWL SRLARPANKT DQLLSLSSMV WAGNAYLADY ARRFNANVQI IPTVVDCEQC 
QPRSVPSPHI CTLGWIGSHS TARYLEQIVP VLRQLAQRYR FRLLVVGAAK PIEIEGIECI 
NHDWQQAREW HDFQQIDIGL YPIEADLWAE GKCGLKAIQY GAAAIPSVCS AVGVNQHIVE 
HGQTGFLAHN SAEWLDYLAR LLEDEQLRQT LGQAARQKIE AEYSVQRYQP TIVAALKDYL 
CVESAESSVQ A