Gene Haur_4878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4878
Symbol
ID	5736955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6213291
End bp	6214400
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	52%
IMG OID	641282044
Product	glycosyl transferase family protein
Protein accession	YP_001547636
Protein GI	159901389
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0472] UDP-N-acetylmuramyl pentapeptide phosphotransferase/UDP-N-acetylglucosamine-1-phosphate transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.777733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTGC GATTTGCGCT GGTTTTAGCC ATTGGCACCA GCATCACTTT TATTTTGACT 
CCCTTAATTC GGGCTTGGTG TATTCGCAAG GGTTGGTATG ATCTGCCTGA GGCGCGGCGT 
GTGCATCAGA TTCCGACTCC ACGACTGGGC GGGGCGGCCA TATTTGCCGG CTTTATGGCG 
GCGTTGGCGG CGGCAGTCGT CGTGCCTTGG GGTGTGCCGC AAATGCAGCG CTTCCCGATT 
GAAAGCTTTC GCTTGGGCTT GCTGGCTGCG GGTGCAACCC TGATGTGGGT CGTGATGACC 
ATCGACGATC TCAAAAAACT TTCGGCTCGT TTCCGCTTGA TCATTCAAAT CCTAGCGGCA 
TTGATTGCGG TTGGTCCCTA TTTATGGGAA TGGACACTGC ATCCAGCGGT TAATGGGATT 
GATGTGGGGG CGCGAGGGAT TATTGCAACG GCCTTTAACA CGCCGTTTAT GCAAGTGAAT 
TTTCATGAAA TATGGCCGCC CTTGGCAATC GGCTTCACAA TTTTTTGGAT TGTAGGTATG 
ACCAATGCGC TCAACTGGAT CGATGGCTTA GATGGTTTGG CGGCGGGCGT GACGTTTATT 
GCGGCGATTG TGCTCGCGAT TCATACCTAC TCGCTGGGCC AATATTCCTT GGTACTTGTG 
CCCTTGGCTT TGGCTGGAGC CTGCTTGGGC TTCTTACCGC ATAATTTCCA CCCGGCCAAA 
ATTTTTATGG GCGATGGTGG CGCGATGGTA ATTGGCTATA CTTTGGCGAT TTGCTCGATC 
ATCGGTGGAG CCAAGCTTGC CACAGCCTTG TTGGTGTTGG GCGTACCCTT GCTCGATGGC 
GTGTGGATGA TCATCTGGCG GCGAGTGCGC GGAGCAGGGG CTAGCGTCTC AGATCGCGGC 
CATTTGCACC ATCGTTTGCT TGATTTAGGC CTCTCGCAGC GCCAAGTTGT GGCGTTTTAC 
TACACAGTCA GCAGCTTATT TGGTAGCTTG GGCTTGTTAT TACCCGATAG CTGGTGGAAA 
TTGGGAGCTT TGGCGATTTT GACAGGCTTG ATGATTGGGC TGCTTTTCTA TTTGGCCCGC 
AAACAACCCC AAACCCAAAA TTCACATTAA

Protein sequence

MILRFALVLA IGTSITFILT PLIRAWCIRK GWYDLPEARR VHQIPTPRLG GAAIFAGFMA 
ALAAAVVVPW GVPQMQRFPI ESFRLGLLAA GATLMWVVMT IDDLKKLSAR FRLIIQILAA 
LIAVGPYLWE WTLHPAVNGI DVGARGIIAT AFNTPFMQVN FHEIWPPLAI GFTIFWIVGM 
TNALNWIDGL DGLAAGVTFI AAIVLAIHTY SLGQYSLVLV PLALAGACLG FLPHNFHPAK 
IFMGDGGAMV IGYTLAICSI IGGAKLATAL LVLGVPLLDG VWMIIWRRVR GAGASVSDRG 
HLHHRLLDLG LSQRQVVAFY YTVSSLFGSL GLLLPDSWWK LGALAILTGL MIGLLFYLAR 
KQPQTQNSH