Gene Haur_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1066
Symbol
ID	5732970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1218561
End bp	1219562
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	52%
IMG OID	641278201
Product	ribokinase-like domain-containing protein
Protein accession	YP_001543842
Protein GI	159897595
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2870] ADP-heptose synthase, bifunctional sugar kinase/adenylyltransferase
TIGRFAM ID	[TIGR02198] rfaE bifunctional protein, domain I

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCATGA TCACGGTTGA ACATGTGGCC CAACTCGCCA ATCGCCGCGT ACTGGTGGTT 
GGCGATGTTG TGCTCGATGA ATATTTGTAT GGCAAGCCCG AACGGCTCTC GCGCGAGGCA 
GCAATTCCGG TTTTAGAATT TGAGCAGCGG CGGATTATCC CTGGTGGTGC GGCCAATCCC 
GCCGCCAACA TTACAGCGCT CGGCAGCAAT GCTGGCATCG TGGCGTTAAT CGGCGCTGAT 
CAGGCTGGTC AAGAATTAGC CAATGCCTTA CATAAACGCA AGGTCAGCAC CGCTGGCTTG 
CTGCGCGATG AGCAACGCCC AACCACCACC AAAACCCGTA TTTTGGCCTC GGTGCAATTG 
ACCGTGGCCC AACAAGTCGC GCGGCTCGAT AAAATTGATC GGCGGCCGGT TGACCCAGCT 
TTTGAAGATC AGGCGATCGA ATTATTAGGC CAATTAATTC CCCAAGTTGA TGCTGTGCTG 
TGCTCAGATT ATCGCGTGGG CTGGCTTAGT GAGCGGCTTA TTCAACACAT TCAACAATTA 
TGTCAACAAT ATCAAACCTT GCTGACAGTT GATAGCCAAG GCCGCTTTGA ACCCTACGCT 
GGAGCCGATT TTCTCAAGTG CAATTTGGGC GAGGCTGAGG CTTGGCTTGG CCAGCGTTTA 
ACCAATGATC AGCAGGTTGA ACAAGGCTTA GAACGCTTGC GCGATCAGCT CAAATTGGCG 
GCAGTGGTGA TTACCAGAGG CGGGGCAGGC TTTTCGTTGC TTGATCCAGC AGGCATTCAT 
CATATTCCAG CAGTGCCAAT TGGCGAAGTT TTTGATGCAA CCGGGGCGGG CGATACCTTT 
ATTGCCACCG CAACGCTTAG TTTGTGTGCT GGCCATAGCC CATTAATTGC CGCCCAACTT 
GCTAATACTG CGGCGGCCTT GGTAGTACGA CGAATTGGCG TGGCCACAGT TAGCCCCAAC 
GAACTGCAAA ACGCATTAAT TCAATTTGGC CAGATTGTAT GA

Protein sequence

MCMITVEHVA QLANRRVLVV GDVVLDEYLY GKPERLSREA AIPVLEFEQR RIIPGGAANP 
AANITALGSN AGIVALIGAD QAGQELANAL HKRKVSTAGL LRDEQRPTTT KTRILASVQL 
TVAQQVARLD KIDRRPVDPA FEDQAIELLG QLIPQVDAVL CSDYRVGWLS ERLIQHIQQL 
CQQYQTLLTV DSQGRFEPYA GADFLKCNLG EAEAWLGQRL TNDQQVEQGL ERLRDQLKLA 
AVVITRGGAG FSLLDPAGIH HIPAVPIGEV FDATGAGDTF IATATLSLCA GHSPLIAAQL 
ANTAAALVVR RIGVATVSPN ELQNALIQFG QIV