Gene BURPS1710b_2790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2790
Symbol	hutG
ID	3691558
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	3095650
End bp	3096684
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	71%
IMG OID	637729246
Product	N-formylglutamate amidohydrolase
Protein accession	YP_334174
Protein GI	76809406
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3741] N-formylglutamate amidohydrolase
TIGRFAM ID	[TIGR02017] N-formylglutamate amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGCGAAC GCCGGACGCT ACGAACGGAC GGCGGCGCGG ATGGCCTGCG GCGCGGTCAG 
CATGAATCCG GCGCGCGGCG TCGAGCGCTA CGGCGGGCCG CCGCTCGCGC CTCGGCGCAA 
TGCCCGCCCG TCGAGCGTTT CGCGCGCACG ATACCGCGGC CGGCCGCCGC GTGCACCATG 
GAGCCGCCGG CGGGCCGGGG CGCGCCGCAT CATCAACGAG GTCGAACGAT CATGAACACC 
GCATCGCAAC CGCCGGTATT CACGCTGCAT CGCGGCACGC TGCCGCTGCT CGTGTCGATA 
CCGCACGCGG GCACTCACCT TCCCGATGAC ATCGCCGCGA CGATGACGCC CGTCGCTCGC 
CACGTCGACG ATTGCGACTG GCATCTCGAG CGTCTGTACG ATTTCGCGAA GACGCTCGGC 
GCGTCGGTGC TCGTGCCTTC GCACGCGCGC TACGTCGTCG ATCTGAACCG CCCGCCGGAT 
GACGCGAATC TCTACCCGGG GCAGGACACG ACGGGCCTCG TGCCGGTCGA CACGTTCGAC 
AGGGCGCCGC TGTACGCGCA CGGCCACGAG CCGACCGTCA CCGAGATCGC GCGCCGCCGC 
GAACGCTATT GGGCGCCGTA TCACGGCGCG CTCGCGGGCG AACTGCAACG GCTGAAGGAC 
GCGCACGGCC GCGCGCTGCT GTGGGAGGCG CATTCGATCC GCTCGCACGT GCCGCGCTTC 
TTCGACGGCC GGCTGCCCGA CTTCAACTTC GGCACGTCGA GCGGCGCGAG CGCCGCGCCC 
GGGCTCGCCG ACAAGCTGGC CGCGCTCGTC GACCGGCACG GCGGCTATAC GGCGATCGCG 
AACGGGCGCT TCAAGGGCGG CTACATCACG CGTCACTACG GCGCGCCGGA GCAGGGCGTG 
CAGGCGGTGC AGCTCGAACT CGTGCAGGCG ACCTACATGG ACGAGACGCG GCCTTATTCG 
TACGACGAAA CCAGGGCGCG GCGGATCGCG CCGCTGCTCG AAGCGCTCGT GAGCGCCGCG 
CTCGAGCATC ATTGA

Protein sequence

MRERRTLRTD GGADGLRRGQ HESGARRRAL RRAAARASAQ CPPVERFART IPRPAAACTM 
EPPAGRGAPH HQRGRTIMNT ASQPPVFTLH RGTLPLLVSI PHAGTHLPDD IAATMTPVAR 
HVDDCDWHLE RLYDFAKTLG ASVLVPSHAR YVVDLNRPPD DANLYPGQDT TGLVPVDTFD 
RAPLYAHGHE PTVTEIARRR ERYWAPYHGA LAGELQRLKD AHGRALLWEA HSIRSHVPRF 
FDGRLPDFNF GTSSGASAAP GLADKLAALV DRHGGYTAIA NGRFKGGYIT RHYGAPEQGV 
QAVQLELVQA TYMDETRPYS YDETRARRIA PLLEALVSAA LEHH