Gene Haur_4271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4271
Symbol
ID	5736130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5452131
End bp	5453240
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	53%
IMG OID	641281431
Product	glycosyl transferase group 1
Protein accession	YP_001547031
Protein GI	159900784
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATATTA TTCACTACAA TCTGACGACT ACTAGCAAAG TCGGCGGGGT TGAGAGTTTT 
GTTTGGGAAT TGGCGCAGCA GCAAGTTCGG CTCGGCCATC GGGTGACGAT TGTTGGTGGT 
CAAGGCCCAA TTCAACGGCC AAATCAGGGC TTGCGGGTGC TAAAATTCCC ATTTATTGAT 
CGGGCACGTT TGGCTTGGGG GCCGTTACGT CGCGCTTATG CTTGGCGCAA ATTGGCCGAA 
CGCTTGTCGC TGCTGCCACG GGCTTGGCCT ATTTTGAAAA CTGCCGATTT GGTGCATATT 
CACAAGCCTT ATGATTTGGT CGTGGCTCCA TTGCTCAAAC GCCATGGCAT TCCCACGGCT 
TATCACGGCC ATGGCGAAGA TTTTTTTCGC GGCGATGTTC AGCTGATGCA GTCAGCCGCC 
GTGCTGCTTT CGTGCTCTAG CTACAATGCC CAAACCTTGC AGCAACATTA TGGGCGCACG 
GCGAGCGTGG TCTATAACGG CGTTGATGTC GAGCATTTTC GACCTTTGGC GCTAGATCCA 
GCATTACGCC AAGCAATTGC TGGCGATGCT CAATGGTTAT TGATGCATCC TGGGCGCATG 
ATGCCTTGGA AAGGTCAGCG CGATGCAATT AGTGCCTTGA GTTTGCTCGA TCACACCTAT 
CATTTGGCCT TTTTAGGCGA TGGCGAAACC CGCCAAGCCT TGGCTGACTA TGCCCAACAA 
TTAGGCATTG CCGAACGCGT GCACTTTCTT GGCACAATTG CCCACAGCGA ATTGCCGCGC 
TATTTGGCCT GCGCCGATTT GGTGCTTGGT ACGAGTTATA CATCAGAGAC GTTTGGCATG 
GCCTTAGCCG AAGCCCAAGC CTGTGGCCGG CCCGTTATCG CCTCGTCGTG GCGTGGTTAT 
GATGATGTGG TGCAAGCTGG CAGCACTGGC GAACGCTTTA TCGCCCAAAA TTCAGCCGAT 
TTAGCTCGCG TTATCAGCCA ACTTTGCCAC GATTCAGCCT ATCGTGAGCA ACTAGCGCGT 
GCTGGTCGCC AACGGGTGCA ACAATTGTTC CCGTGGTCGG CTGTCGCCGA GCGAGTTGAA 
GTGGTGTATG AGGGGTTAGT TAGTTGCTAG

Protein sequence

MHIIHYNLTT TSKVGGVESF VWELAQQQVR LGHRVTIVGG QGPIQRPNQG LRVLKFPFID 
RARLAWGPLR RAYAWRKLAE RLSLLPRAWP ILKTADLVHI HKPYDLVVAP LLKRHGIPTA 
YHGHGEDFFR GDVQLMQSAA VLLSCSSYNA QTLQQHYGRT ASVVYNGVDV EHFRPLALDP 
ALRQAIAGDA QWLLMHPGRM MPWKGQRDAI SALSLLDHTY HLAFLGDGET RQALADYAQQ 
LGIAERVHFL GTIAHSELPR YLACADLVLG TSYTSETFGM ALAEAQACGR PVIASSWRGY 
DDVVQAGSTG ERFIAQNSAD LARVISQLCH DSAYREQLAR AGRQRVQQLF PWSAVAERVE 
VVYEGLVSC