Gene HS_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0421
Symbol	guaA
ID	4239897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	449845
End bp	451416
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	43%
IMG OID	638103964
Product	GMP synthase
Protein accession	YP_718631
Protein GI	113460567
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAATA TTCACCATCA CAAAATTTTA ATTTTAGACT TCGGTTCACA ATATACGCAA 
CTTATCGCAC GTCGTGTACG TGAAATCGGG GTATATTGCG AACTTTGGGC TTGGGACGTT 
ACGGAAGAAC AAATTCGTGA GTTTAACCCA ACAGGAATTA TTCTTTCAGG CGGACCGGAA 
AGTACTACTG AGGCAAATAG TCCACGTGCA CCGGAATACG TTTTCAATGC AGGCGTACCT 
GTTTTAGGTA TTTGCTACGG CATGCAAACC ATGGCAATGC AGTTGGGCGG TTTAACAGAA 
ACTTCTACGC ATCGTGAGTT TGGCTATGCT GAAGTTTCTC TACGAAATCC GACCGCACTT 
TTTGATCATC TCAATGATGA TGCGACCACT TCTCAGACTA CACTTGATGT TTGGATGAGC 
CACGGCGATA AAGTGACTCG CCTACCTGAT AATTTCCAAA TTACAGGCAT GACCTCGACT 
TGCCCGATTG CGGCTATGTC AGATGAAAGC CGTCGTTTCT ATGGCGTGCA ATTTCACCCC 
GAAGTTACCC ACACAAAGTG CGGTCAAAAA TTACTGCAAA ATTTTGTGGT AGATATTTGC 
GGTTGCGAAA CCAATTGGAC CGCAGAAAAT ATCATCGAAG ATGCAGTGGC TCGCATTAAA 
GCACAAGTGG GCGGTGATGA AGTAATTTTA GGCTTGTCAG GTGGCGTGGA TTCATCTGTT 
ACCGCACTTT TATTGCATCG TGCCATCGGT AAAAATTTAC ATTGTGTCTT TGTCGATAAC 
GGCTTACTCC GTCTAAATGA AGGCGATCAG GTCATGGAAA TGTTCGGTGA TAAATTCGGC 
TTGAATATTA TTCGAGTAGA AGCAGAAGAT CGCTTTTTAG AAGCATTAAA AGGAATTGAT 
GAACCGGAAG CAAAACGCAA AACTATCGGT AAAGTATTCG TTGATGTATT CGATGATGAA 
GCAAAAAAAT TAACTGACGT AAAATGGTTA GCTCAAGGAA CGATTTACCC TGATGTTATC 
GAATCGGCAG CAAGCAAAAC CGGAAAAGCC CACGTTATCA AATCTCACCA CAATGTAGGA 
GGCTTACCCG ATTATATGAA ATTAGGTTTA GTTGAGCCAT TACGTGAACT CTTCAAAGAT 
GAAGTGCGTA AAATCGGCTT GGCACTTGGC TTGCCTGCAG AAATGCTTAA TCGCCACCCA 
TTCCCAGGCC CTGGATTAGG TGTACGTGTA CTGGGTGAAA TCAAAAAAGA ATATTGCGAT 
TTACTGCGTA AAGCCGATGC AATTTTTATC GAAGAACTGC ATAAAGCAGA TTGGTACTAC 
AAAGTCAGCC AAGCGTTCAG TGTTTTCTTG CCGGTAAAAT CTGTCGGGGT AATGGGCGAC 
GGTCGTAAAT ATGATTGGGT TATTAGCCTA AGAGCGGTCG AAACCATTGA CTTTATGACC 
GCACATTGGG CAAACCTACC TTATGATTTA TTAGGCAAAA TCTCAAATCG CATTATCAAC 
GAAGTCAACA GCATCTCCCG TGTAGTTTAT GACATCTCAG GAAAACCACC AGCAACGATT 
GAGTGGGAGT AG

Protein sequence

MTNIHHHKIL ILDFGSQYTQ LIARRVREIG VYCELWAWDV TEEQIREFNP TGIILSGGPE 
STTEANSPRA PEYVFNAGVP VLGICYGMQT MAMQLGGLTE TSTHREFGYA EVSLRNPTAL 
FDHLNDDATT SQTTLDVWMS HGDKVTRLPD NFQITGMTST CPIAAMSDES RRFYGVQFHP 
EVTHTKCGQK LLQNFVVDIC GCETNWTAEN IIEDAVARIK AQVGGDEVIL GLSGGVDSSV 
TALLLHRAIG KNLHCVFVDN GLLRLNEGDQ VMEMFGDKFG LNIIRVEAED RFLEALKGID 
EPEAKRKTIG KVFVDVFDDE AKKLTDVKWL AQGTIYPDVI ESAASKTGKA HVIKSHHNVG 
GLPDYMKLGL VEPLRELFKD EVRKIGLALG LPAEMLNRHP FPGPGLGVRV LGEIKKEYCD 
LLRKADAIFI EELHKADWYY KVSQAFSVFL PVKSVGVMGD GRKYDWVISL RAVETIDFMT 
AHWANLPYDL LGKISNRIIN EVNSISRVVY DISGKPPATI EWE