Gene HS_0549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0549
Symbol	purT
ID	4240032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	582060
End bp	583241
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	41%
IMG OID	638104098
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_718760
Protein GI	113460694
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATAT TAGGAACAGC TTTAACACCT AAAGCAACAA AAGTCATGCT TCTTGGTTCA 
GGTGAACTAG GCAAAGAAGT CGTTATAGAA TTACAACGTC TTGGTGTAGA AGTGATTGCG 
GTAGATCGCT ATGAAAATGC ACCGGCACAA CAAGTTGCAC ACCGCTCTTA CACTATTTCA 
ATGTTAGATG GAAATGCTTT GAAAGCATTA ATTGAAAAAG AAAAACCGGA TTATATCGTG 
CCGGAAGTCG AAGCAATCGC AACCTCAACA CTAGTTGAAT TGGAGCAAGC CGGCTTTAAT 
GTTGTCCCAA CTGCTAAAGC TACACAATTA ACGATGAACC GTGAAGGTAT TCGTCGCCTT 
GCAGCAGAAA AATTAAAGTT GCCAACATCA AATTATCAAT TTGTAGATAA TTTTGATGAC 
TTTCAAAGTG CGGTCGAAAA CCTTGGCATT CCTTGTGTGA TCAAACCGAT TATGTCTTCT 
TCTGGACATG GTCAGAGTAT CTTAAAAAGC AAAGACGACC TACAAAAAGC ATGGGACTAT 
GCACAACAAG GGGGAAGAGC GGGAGCCGGT CGAGTGATCG TTGAAGGTTT CGTTAAATTT 
GATTATGAGA TTACTTTATT AACAGTACGC CATGCAGAAG GAACTTCATT TCTAGCACCT 
ATCGGACATC GTCAAGAAAA AGGGGACTAT CGTGAGTCTT GGCAACCGCA AGCAATGTCT 
GTACAAGCAC TCGCCAAGGC TCAACATATT GCTGAGAAAA TTACTACGGA ACTCGGCGGA 
CGCGGCATTT TTGGTGTAGA AATGTTTGTC TGTGGAGATG AAGTGATTTT CAATGAAGTA 
TCTCCTCGCC CTCATGATAC AGGAATGGTT ACGTTGATCT CGCAAGAGCT TTCTGAATTT 
GCACTTCATG CAAGAGCCAT ATTAGGATTA CCAATTCCTG AAATTAATTT AATTAGCCCA 
GCCGCCTCAA AAGCGATTGT CGTTGAAGGC AAATCTAACC AAGTACAATT TGGTAATTTA 
TTCGAAGTAT TACAAGAACC TAATACTAAT ATTCGCTTAT TCGGCAAAGG CGAAGTCAAT 
GGGCATCGTC GCTTAGGTGT TATTCTTGCA CGTGATATTT CTGTTGATAA GGCGTTAGAA 
AAAGTTTCTC GAGCCTATGA TAAATTAGAC ATACAATTGT AG

Protein sequence

MTILGTALTP KATKVMLLGS GELGKEVVIE LQRLGVEVIA VDRYENAPAQ QVAHRSYTIS 
MLDGNALKAL IEKEKPDYIV PEVEAIATST LVELEQAGFN VVPTAKATQL TMNREGIRRL 
AAEKLKLPTS NYQFVDNFDD FQSAVENLGI PCVIKPIMSS SGHGQSILKS KDDLQKAWDY 
AQQGGRAGAG RVIVEGFVKF DYEITLLTVR HAEGTSFLAP IGHRQEKGDY RESWQPQAMS 
VQALAKAQHI AEKITTELGG RGIFGVEMFV CGDEVIFNEV SPRPHDTGMV TLISQELSEF 
ALHARAILGL PIPEINLISP AASKAIVVEG KSNQVQFGNL FEVLQEPNTN IRLFGKGEVN 
GHRRLGVILA RDISVDKALE KVSRAYDKLD IQL