Gene Haur_1530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1530
Symbol
ID	5733417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1784091
End bp	1785272
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	49%
IMG OID	641278670
Product	glycosyl transferase group 1
Protein accession	YP_001544302
Protein GI	159898055
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATACT CGCTGGATAA TCGTTTGTTT GCAGGTTTAG AAATAGAGTT TATGCATTTT 
ACAATTAATG GTCATTTGCT CTCATTTGAT AGCTCTTTTC GGCAGGCTGG GGTTTCTAAT 
CACACCCGTT TTTTGATTGA AAACTTAGCC AAGCTCGACC ACGATAACCA ATACACCCTA 
TTTGTAGGGC CAAATGTGCG CCAACACCTC AATTTGCCAG CCAACTGGGA GATTGTCGAA 
TCGCGCTTGC CCACAATTCA GCCCAAATAT CGCATTCCTT GGGAGCAATT GATTGCACCC 
TGGTTATTAG CCAAACGCCG AGTCAATTTG TTTCATGGCT TGTTGAATAT CTCGCCGTTG 
CTTTCGCCAG TACCAACCAT CGTCACGATT CATGATTTGG CATTTATGGA TGTGACTGGT 
TCGCATCGCA AGGCCAATCG GCGTTATTTG GCGGCAGCAA CTCGCCAAGG TGTGCGTCAA 
GCTGCCCATC TATTTGCGGT TTCTGAGTAT ACCAAGGCCG CGATGGTCGA TCGGCTTGGG 
CTTGATCCCG CTAAAATTAG CATTGCCTAT AATGCGGCTG GAGCGCAGTA TCACCCGCGT 
TCGACCGCTG AAATTCATGC TTGGAAGCAG CAAAAGCAAC TGCCTGAGCA ATTTCTACTG 
TATCTTGGCA CCTTAGAGCC ACGCAAAAAT ATTCCCAATT TGCTGCGAGC TTATGCCAAA 
GTTAAACACG AAATTGGCAT GCCATTGTTA ATTGGTGGTG GCAAAGGCTG GAATTTTGAC 
GAAATTTTCA GTACTTACGA GCAATTACAA TTGCACGATA GTGTCAGTTT CTTGGGCTAT 
GTGCCAGGCG AGGAATTACC GTTGTGGTAT AACGCCGCGA CAGCCTTTAT CTATCCATCG 
CGCTACGAAG GCTTTGGGAT TCCGCCGCTT GAGGCGATGG CTTCGGGCAC ACCCGTGCTG 
ACTACCAATG CCACCAGCAT TCCCGAAGTC GTGGGCGATG CGGCGATTCA AGTTGACCCC 
GATAATCTTG AGCAGATGGC CCAAGAATTA GTGCGGATTG CCAACGATGC CAGTTTGCGC 
GACGATCTGC GTGAACGCGG TTTGCTGCGT GCCCAAGCCT TCTCGTGGGA GAATTTGGCC 
AAAGCCACGC TTGAGGTTTA TCGCAAGGTT GGGGGCGAAT AG

Protein sequence

MLYSLDNRLF AGLEIEFMHF TINGHLLSFD SSFRQAGVSN HTRFLIENLA KLDHDNQYTL 
FVGPNVRQHL NLPANWEIVE SRLPTIQPKY RIPWEQLIAP WLLAKRRVNL FHGLLNISPL 
LSPVPTIVTI HDLAFMDVTG SHRKANRRYL AAATRQGVRQ AAHLFAVSEY TKAAMVDRLG 
LDPAKISIAY NAAGAQYHPR STAEIHAWKQ QKQLPEQFLL YLGTLEPRKN IPNLLRAYAK 
VKHEIGMPLL IGGGKGWNFD EIFSTYEQLQ LHDSVSFLGY VPGEELPLWY NAATAFIYPS 
RYEGFGIPPL EAMASGTPVL TTNATSIPEV VGDAAIQVDP DNLEQMAQEL VRIANDASLR 
DDLRERGLLR AQAFSWENLA KATLEVYRKV GGE