Gene Haur_4385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4385
Symbol
ID	5736235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5601904
End bp	5603040
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	47%
IMG OID	641281547
Product	glycosyl transferase group 1
Protein accession	YP_001547145
Protein GI	159900898
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.610092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGGATTG GGATTAGTGG CACATTTTGG GCTGAACCAA TGGTGGGCAG CGGTCAGTAT 
TTACATCATT TAATTGAACA TTTGCCGCAT GTTGGTCCTC AGCACGAATA TGTGTTGTTT 
TTGCCAGCCT ATACCCAAGC CGAAATTCCT CAAATTCCGC ATATTGCGGT TGATCGTGTG 
CCAACGCCGT TTGATAAACT ACACCCTAAA TTGGCCAAGC TTTGGTATGA GCAAATTGAG 
TTGCCCCGCG CCGCCTTGCG CTTAGCCGTT GATCTGTTGC ATGTGCCCTA TTATGCGCCG 
CCACGTCGCC AATTAGTGCC GACTGTGGTA ACAGTCCACG ACATTATTCC ATTAATTTTG 
CCTGAATACC GTGGCTCGTT GGCGATGCGA GCCTATACTG CCCTGGCAAC GAGTGCTGTG 
CGCCGTTGTC GTCAATTGGT GGCAGTCTCC GACCATACCC GCGATGATAT TATTGATGTA 
TTGAATATTA ATGCATTACA CGTGCATACA ATTTACGAAG GCGTTGCACC TGATTATCAA 
CCGCAGACAG ATGAACAGAT TAGCCAAACC TTGCAACGTT TTAATCTTAA TCAGCCTTAT 
TTTTATTATA TCGGCGGCTT TGATGTGCGC AAAAATCTCA CGACATTGCT GCGGGCATTT 
GGGCGGGTGC GTCGCCGAAT TGAGCAACCA ATTAAATTAG TGATTGCTGG CAGCCGTCCT 
AAGGCTAATT CGCCATTTTT TCCTGCTTTA GAAACCACAA TTCTTGATGA AGATTTGGCT 
GCTGATATTA TTTTTACTGG GCGCGTCACG AATGCTGAAA ACGCCGCGCT ATTTGCTGGA 
GCCAGTGCAT TTGTTTGGCC CTCGACCTAT GAAGGTTTTG GCTTGCCCCC ATTAGAAGCG 
ATGAGTTGTG GTACGCCCGT GATTTCTTCG AATACCAGCA GCATGCCCGA AATTGTCGGC 
GAGGCTGGTA TTTTGCTGCC GCCACACGAT ACCGAGGCTT GGGCGATGGC AATGTTGCGC 
ATGTTGAATG ATGCTGAATT AAATAACGAA TATCGCCAAC GTGGTTTACA ACGAGCCAGC 
CAATTTAATT GGCAACACTT TACCGCCCAG ATGCTTAAGG TTTATGAGAA AGCCTAG

Protein sequence

MRIGISGTFW AEPMVGSGQY LHHLIEHLPH VGPQHEYVLF LPAYTQAEIP QIPHIAVDRV 
PTPFDKLHPK LAKLWYEQIE LPRAALRLAV DLLHVPYYAP PRRQLVPTVV TVHDIIPLIL 
PEYRGSLAMR AYTALATSAV RRCRQLVAVS DHTRDDIIDV LNINALHVHT IYEGVAPDYQ 
PQTDEQISQT LQRFNLNQPY FYYIGGFDVR KNLTTLLRAF GRVRRRIEQP IKLVIAGSRP 
KANSPFFPAL ETTILDEDLA ADIIFTGRVT NAENAALFAG ASAFVWPSTY EGFGLPPLEA 
MSCGTPVISS NTSSMPEIVG EAGILLPPHD TEAWAMAMLR MLNDAELNNE YRQRGLQRAS 
QFNWQHFTAQ MLKVYEKA