Gene Haur_4665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4665
Symbol
ID	5736512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5962683
End bp	5963786
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	52%
IMG OID	641281829
Product	glycosyl transferase group 1
Protein accession	YP_001547424
Protein GI	159901177
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGCGA TCGATGCTCG TTTGAATGCC TACCGCCATG GTGGCATTGC CCAATACACC 
CAAAAATTGC TGACCTACTT GCCCAAGATC GCGCCTGAGC AACAATGGTT AGTACTGGAG 
CATCGCAAAA GCCCCAAGCC CTTGGCGCTT GGCCCCAACA TTCAGCGAGC ACGCTTATTC 
ACCCCACCCC ATCATCGCTT AGAACAAGTG CTTTTGCCCA TGGAAATTGG CCTGCGCCGC 
CCCAAACTGC TGCACTCGCC TGATTTTATT CCGCCGCTGT ATCGCACCTT TCCAGCCGTG 
ATCACCGTGC ATGACTTAGC ATTTAAATTG TTTCCTGAAA TTTTGGATGC CAACGCCAGC 
CGTTATTATG GCCAAATTGA GCGAGCGCTG GCCTCAGCCA ATGCAATTAT TGCCGATTCG 
CAGAGCACCG CCAACGATCT GACCAACTTG TTAAATGTTG ATCCAGCGCG AATTGATGTG 
ATTCATCTGG CAACCGATAT GCAACCAATC GCGCTCGCCA GCGTTGCTCA ACGCCAAATT 
GGCAACAATA TTTGGCAGGC TGATCAATTT ATGCTGTTTG TTTCAACCCT AGAGCCACGC 
AAAAATATCC CAATGTTGCT ACGAGCCTTG CGAATTGCCG TTGATCGCAA GCCGCAAGCT 
GGCTATCGCT TGGCGTTGGC GGGGCGGCGC GGCTGGCTCG ATGGCGAAAT TTGGCAAACC 
CTCGCTGAAT TACACTTAGA AGATGTTGTG ACTTGGATCG ATAGCCCAAG CGATGAGGAA 
ATTCGCTGGC TGTTGAGCGC CTGCCGCTTG TATCTCAACC CTTCGCGCTA TGAAGGCTTC 
GGCTTACCAG CCTTAGAAGC CTTGGCTTGT GGCGCGGCGG TAGTGGTAGC TGATGCCTCA 
AGTTTGCCTG AAGTGGTCGG CGATGCTGGC CTCAAATTGC CAGTTGCTGA TCCGCTAGCC 
TGGGCTGATA CGATTGAACA TTTGTGGGAA GATCAAACTG CTCGGCAAGT TTTGCGCGAT 
CAAGCCCCTG CCCAGGCCGC TAAATTTTCA TGGCAACGCA CTGCTGAGCA AACCTTGGCA 
GTTTATCGGC GCGTGCTTGA TTAA

Protein sequence

MIAIDARLNA YRHGGIAQYT QKLLTYLPKI APEQQWLVLE HRKSPKPLAL GPNIQRARLF 
TPPHHRLEQV LLPMEIGLRR PKLLHSPDFI PPLYRTFPAV ITVHDLAFKL FPEILDANAS 
RYYGQIERAL ASANAIIADS QSTANDLTNL LNVDPARIDV IHLATDMQPI ALASVAQRQI 
GNNIWQADQF MLFVSTLEPR KNIPMLLRAL RIAVDRKPQA GYRLALAGRR GWLDGEIWQT 
LAELHLEDVV TWIDSPSDEE IRWLLSACRL YLNPSRYEGF GLPALEALAC GAAVVVADAS 
SLPEVVGDAG LKLPVADPLA WADTIEHLWE DQTARQVLRD QAPAQAAKFS WQRTAEQTLA 
VYRRVLD