Gene Haur_4855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4855
Symbol
ID	5736701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	6186585
End bp	6187613
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	53%
IMG OID	641282021
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001547613
Protein GI	159901366
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCT ATAAGGATGC TGGCGTTGAT ATTGCAACCA AAATGGATGC GATCCAACAG 
ATGGGAGCCG CAGTTAAGGC CACCCATACG CCAGCAGTGT TGGCAGGTTT AGGCGCGTTT 
GGCGGCTGTT TTGATTTGGC TCAGGTTAAT GCAAGCCATG CGCAGCCAGT TTTGGTAGCC 
TCGACCGATG GGGTTGGCAC CAAAACAGCG GTGGCCGCAG CCGTTGGCGA TGTACGCACG 
ATTGGCGCAG ATCTCGTTAA CCATTGTATT AATGATATTT TGTGCCAAGG CGCAACGCCA 
CTCTTTTTTC TCGATTATAT TGCGGCCTCA AAGCTTGAGC CAGCCATGGT TGTGGCCGCA 
GTTGAGGGGC TAGCAGCAGC CTGTCGTGAT GCAGGAATTG CCTTGCTTGG CGGCGAAACT 
GCCGAAATGC CAGGCGTTTA CCACGATGGA GCCTTTGATG TAGCAGGAAC AATCGTCGGT 
GTGGTTGATC GGGCGCATAT GCTTGATGGC AGCGCAATTA AGCCAGGTGA TGTGGCAATT 
GCCTTGCCTT CGACGGGCTT GCACACCAAT GGCTATTCGT TGGCGCGAAA AGTTTGCGCA 
CCCTTAGGCT ATGCCAGCCA ACCAACAATT TTAGCTGGTT TGAGCATTGG CGAGGCTTTG 
CTGGCTCCGC ATCGGGCCTA TTTGCACGAA GTTCAGGCCT TGCGTCAAGC AGATGTGGCG 
ATTCACGGTT TGGCCCATAT CACTGGCGGC GGCATTTGGG ATAACATTCC GCGGGTATTG 
CCAGCCAACG TGACAGTCGA ATTAGTTCGT GGTTCATGGC AAGTTCCAGC AATTTTTAAA 
TTAATTGTGG AACAAGCGGC GATGGATGAA CACGAGGCCC ATCATGTGCT CAATATGGGC 
TTGGGCATGA TTCTATTTAT TGCGGCTGAA CAGGCTGAGC AAGCACTCGC AACCATCAGC 
GATGCCCAAC TGGTCGGACG GGTGATCGAG CAAATTAATC AACCGCGAGT GGTGCTAGTA 
GATCACTAG

Protein sequence

MTTYKDAGVD IATKMDAIQQ MGAAVKATHT PAVLAGLGAF GGCFDLAQVN ASHAQPVLVA 
STDGVGTKTA VAAAVGDVRT IGADLVNHCI NDILCQGATP LFFLDYIAAS KLEPAMVVAA 
VEGLAAACRD AGIALLGGET AEMPGVYHDG AFDVAGTIVG VVDRAHMLDG SAIKPGDVAI 
ALPSTGLHTN GYSLARKVCA PLGYASQPTI LAGLSIGEAL LAPHRAYLHE VQALRQADVA 
IHGLAHITGG GIWDNIPRVL PANVTVELVR GSWQVPAIFK LIVEQAAMDE HEAHHVLNMG 
LGMILFIAAE QAEQALATIS DAQLVGRVIE QINQPRVVLV DH