Gene Haur_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2603
Symbol
ID	5734481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3343584
End bp	3344642
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	641279743
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001545369
Protein GI	159899122
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.22182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATTG GGATTGTGCT TGGCACGCGG CCTGAGGTGA TGAAAAATTA TGCGATTGTG 
CAGGCATTAC GCGCGGCTGA TTTGCCGTTT GTGGTGCTTC ACACCAATCA GCATCATGAT 
CATTTGCTGC AAACCGCGAT TTTTGGCCAA ATGGGCTACA TGCCCGACGA AGTTTTCCCG 
GGCAACTACA GCATCGGCGC AGCGATTGAT TGGGTGCGCG AGCAAATTCG CCGCCATGAC 
ATCGATTTGA TTTTGGTCAA TGGCGATACT GCGGCGGCCT TGGTTGGGGC AATTGCGGCA 
GTCTACTCCG ATGTTGGGTT GGCCCATGTT GAAGCAGGTC TACGAGCTTT CGATAAACGC 
ATGTATGAAG AGCGCAATCG GATTATGGTC GATGGCGCAG CCCATTATTT GTTCTCATAC 
ACCCAATATC AAGCCGATTA TTTGGCCAAA ATTCCCGATT TGCGTGGGCG AATTTTCAAT 
ATTGGCAATA CCACGGTTGA CTTGATTCAT GATTTTGCCC ATGAACTCAC GCCACGCCGC 
AACGATACTT ATGCCTACAT CACCTTGCAT CGCAAGGAAT TTACCGATAG CCGCGAATTG 
ATGCAACAGG TTTTCAGCAC AATCAATGAG CTGGCCCAAG AATTCGATGC CATGATTTTT 
CCGATGCATC CGCGCACGCG GGCGGCCATG GAGCACTATG GTTTGAGCAT GGATCTGCTC 
AGTCGGGTGC AGGTACTTGA TCCAGTTGAG CCATTTGAAT CGCTGGCCTA TGAAAAATAC 
GCCAACATTA TCATCACTGA TAGTGGTTGT ATTCAAGAAG AAGCTTATAT TTTTGGCGTG 
CCCTGTGTGA CGGTACGCGA GAATACCGAG CGGCCTGAAA CGATCGATTC GGGCGCGAAT 
GTGGTCACGG GCTTCGAGCC AACCGCAATT ATCGCGGCGG TGCGCAATCA GCGAGCCAAA 
AAAGGCCAGC AATTCTCCCC AGTTTACGGC GAACGTGGGG TTGGCCAACG GATCGTAGCA 
ACCTTGCAAG CGCATTTTCG CAGTTGGTCG GATTACTAA

Protein sequence

MNIGIVLGTR PEVMKNYAIV QALRAADLPF VVLHTNQHHD HLLQTAIFGQ MGYMPDEVFP 
GNYSIGAAID WVREQIRRHD IDLILVNGDT AAALVGAIAA VYSDVGLAHV EAGLRAFDKR 
MYEERNRIMV DGAAHYLFSY TQYQADYLAK IPDLRGRIFN IGNTTVDLIH DFAHELTPRR 
NDTYAYITLH RKEFTDSREL MQQVFSTINE LAQEFDAMIF PMHPRTRAAM EHYGLSMDLL 
SRVQVLDPVE PFESLAYEKY ANIIITDSGC IQEEAYIFGV PCVTVRENTE RPETIDSGAN 
VVTGFEPTAI IAAVRNQRAK KGQQFSPVYG ERGVGQRIVA TLQAHFRSWS DY