Gene SNSL254_A0852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0852
Symbol	hutG
ID	6485788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	857412
End bp	858353
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	61%
IMG OID	642736264
Product	formimidoylglutamase
Protein accession	YP_002040024
Protein GI	194444635
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	89
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAT GGTATCCGGC TTCTCCGGCG CTCTGGCAGG GGCGCGATGA CAGTATAGAA 
GCGCCGGATG CGCGGCGTCT GTTTCAGACC GTCACGCGCA GCGAGACCTT TTCCCCCGAA 
AACTGGCAGC AAAAGATAGC GTTAATGGGA TTTGCCTGCG ACGAGGGGGT AAAACGCAAT 
GCAGGGCGTC CCGGCGCGGC AGGCGGCCCG GACGCGTTGC GTAAAGCGCT GGCGAATATG 
GCCAGCCACC AGGGACATGA ACGGCTGGTG GATTTAGGCA ATTGGGTTGC GCCGACGCCC 
GATCTGGAAG GCGCGCAGCA GGCCTTGCGC AATGCGGTAA GCCGCTGTCT GCGGGCCGGG 
ATGCGCACGC TGGTGCTGGG CGGCGGGCAT GAAACCGCGT TTGGACACGG CGCGGGGGTG 
CTGGACGCGT TTGCGCAGGA AAGCGTAGGG ATCATTAATC TTGATGCGCA TCTGGATCTC 
CGTCAGACCG ACCGGGCAAC ATCCGGGACG CCGTTTCGTC AACTGGCGCA GCTATGCGAC 
GCGCAGAGCC GCGCGTTTCA TTATGCCTGT TTCGGCGTGA GCCGTGCGGC GAATACGCAG 
GCGTTGTGGC GGGAAGCGCA GTGGCGGAAT GTTACCGTGG TGGAGGATCT TGACTGCCAT 
GACGCGCTGG CGCAGATGAC GCAGTTTATC GACAAGGTGG ATAAAATTTA TCTGACTATC 
GATCTCGACG TATTGCCTGT CTGGGAAATG CCGGCCGTCT CCGCTCCCGC AGCGCTGGGC 
GTGCCGCTGA TACAGGTTCT GCGTTTAATT GAGCCGGTTT GCCGCAGCGG AAAATTACAG 
GCGGCGGATC TGGTTGAATT TAATCCACGC TTTGATGAAG ATGGCGCAGC GGCGCGCGTG 
GCGGCGCGGC TTGGCTGGCA AATCGCGCAC TGGTGGCGTT AA

Protein sequence

MTQWYPASPA LWQGRDDSIE APDARRLFQT VTRSETFSPE NWQQKIALMG FACDEGVKRN 
AGRPGAAGGP DALRKALANM ASHQGHERLV DLGNWVAPTP DLEGAQQALR NAVSRCLRAG 
MRTLVLGGGH ETAFGHGAGV LDAFAQESVG IINLDAHLDL RQTDRATSGT PFRQLAQLCD 
AQSRAFHYAC FGVSRAANTQ ALWREAQWRN VTVVEDLDCH DALAQMTQFI DKVDKIYLTI 
DLDVLPVWEM PAVSAPAALG VPLIQVLRLI EPVCRSGKLQ AADLVEFNPR FDEDGAAARV 
AARLGWQIAH WWR