Gene Haur_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1761
Symbol
ID	5733649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2048152
End bp	2049324
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	53%
IMG OID	641278904
Product	glycosyl transferase group 1
Protein accession	YP_001544532
Protein GI	159898285
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGTCT TATACATCGC CAGCGGCATC CGCGTGCCTG GTGCATTTGG TGGCGCAATT 
CATACAACCG AAGTTGCCCA AGGCTTGGCT CAACTGGGCG TGGAAATGCA TGTGATAACA 
CGACCAGCCC AAGGCCAACG CCGCAAGCCA TGGCAACTGC CCAAGCGCCA AACCGGAGCA 
ATTACTTGGT ACGAAGCTGA TTTGCCAAAG CCTTTGAGTT TGCTTGGCTA TTCAGCAATT 
GCACGGTTGG TACGCGAATT GCGGCCCGAT GCGGTAATGG AACGCTACTA TAATTTTGCT 
GGAGCAGGCA TCTTGGCTGC GGCTCGCCAA GGCATTCCGA CGTTGTTAGA AGTCAATGCC 
TTGATCGTTG ATCCGCCCCA AGTACGCAAG CGCCAACTAG ATGATAGCTT GGCGTGGCTA 
TTGCCTGGCA AGCATGGCCC GATGCGGCGC TGGGCCGCTT GGCAATGCCG GCATAGCACC 
AAAATTGTCA CGCCCTTGCA CACAACCGTG CCACCCGAAA TTGAATGCAG TCGAATCGTC 
GAATTACCTT GGGGCGCGAA TGTTCAGGCA TTTAGCCCAC AAACTCAAGC ACCAATCCAA 
CCAGTGTTTG TCTTTCTTGG TTCGTTTCGC CATTGGCATG GGGTGACCGA TTTTATTCGC 
GCAGCGATTC GTTTGATTCA GCAAGGCAGC CCGGCCCGAT TTTTATTAAT TGGTAGTGGC 
CCAGAACAAG CTGAAGCTCA ACGGTTGGCA GCACCGTATG CCGAACGTTT TGAATGGGCA 
GGGGCAGTAG CTCACGAACG CGTACCAGCC TTGTTAGCGC AGGCTAGCGT TGGGGTTGCA 
CCGTTCAATC CAGCTCGTCA CCCAGCTTTA CAAGCGGCAG GCTTCTTTTG GTCGCCACTG 
AAAATTTACG AATACATGGC GGCTGGCTTG CCCGTAGTAA CAGCTAATAT TCCGCCGCTC 
GATACAATTA TTCGGCCACA GCAAGAAGGT GGGTTATTTG AAGCTGGCAA TATCAACGAC 
CTTGCTCGCG TCATGCAGGC AGTTGCCAAC GACCCGCAAC GCCAACAATG GGGCTTGAAT 
GCTCGCCAAC GCGTGGTCGA GTATTATTCG TGGGAGCGCC ATTGCCAAGC CTTATATCAA 
TTATTGCAAA CCATGATTAA GGAGCAGCCA TGA

Protein sequence

MKVLYIASGI RVPGAFGGAI HTTEVAQGLA QLGVEMHVIT RPAQGQRRKP WQLPKRQTGA 
ITWYEADLPK PLSLLGYSAI ARLVRELRPD AVMERYYNFA GAGILAAARQ GIPTLLEVNA 
LIVDPPQVRK RQLDDSLAWL LPGKHGPMRR WAAWQCRHST KIVTPLHTTV PPEIECSRIV 
ELPWGANVQA FSPQTQAPIQ PVFVFLGSFR HWHGVTDFIR AAIRLIQQGS PARFLLIGSG 
PEQAEAQRLA APYAERFEWA GAVAHERVPA LLAQASVGVA PFNPARHPAL QAAGFFWSPL 
KIYEYMAAGL PVVTANIPPL DTIIRPQQEG GLFEAGNIND LARVMQAVAN DPQRQQWGLN 
ARQRVVEYYS WERHCQALYQ LLQTMIKEQP