Gene YpAngola_A2510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2510
Symbol	hutF
ID	5800980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	2626795
End bp	2628165
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	50%
IMG OID	641340380
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_001606923
Protein GI	162420132
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00394425
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCAGTTT ATTTTACCAA GCGTGCTTTT TTACCTGATG GATGGGCTGC AGACGTGCAA 
ATTGCGGTAG ATGAGCTGGG GGATATACAG CGTATCAGCA CTGGCAGTAG CAGCAGTGGT 
TGTCAGGTTT TATCCGGGCC AGTATTACCT GGTATGCCTA ATCTGCACTC TCATGCTTTT 
CAGCGCATGA TGTCGGGGCT GGCAGAAGTT GCCGGTGATC CACAAGATAG CTTTTGGACT 
TGGCGGGATC TCATGTATCG GTTGGTGCAA CAACTGACGC CGGAACAGGT TGGTGTTATT 
GCCCGGCAAC TTTATATCGA AATGCTGAAA GGCGGATATA CCCAAGTTGC TGAATTTCAC 
TATTTACATC ATAGCCCTGA TGGTTCCCCT TACAATGACA TAGGGGAAAT GACGGCCCAA 
TTGAGTCAGG CGGCACAAGA CGCTGGGATC GGAATGACTT TATTGCCAGT GCTGTATAGC 
TACGCAGGAT TTGGTGCTCA ACCCGCACAG CAAGGCCAGA GCCGTTTTAT TCAGGATACC 
GAGAGTTATC TCAGACAACA GCAGGTTATC CGTCGGCAGT TGGCTAATCA GCCTTTACAA 
AATCAGGGGC TATGTTTTCA CTCATTACGT GCTGTTGAGT TAAGTCAAAT GCAGCAGATT 
TTACACGTAT CGGATAAACA GTTACCGGTA CATATTCATA TTGCTGAACA GCAGAAAGAA 
GTTAATGACT GCCTGGCATG GTGTGGCCAG CGCCCAGTTG CCTGGCTATA TGGTCACTTA 
CCGGTCGATA GCCGCTGGTG CCTTGTCCAC GCGACACATT TGGATACGTC AGAATTGGTT 
ATGTTAGCCA ATAGTCAGGC TGTTGCCGGG TTGTGTCCAA CGACAGAGGC CAATTTGGGA 
GATGGTATTT TCCCCGGTGT TGACTATATA CATCATCAGG GCCGTTGGGG GATAGGTTCT 
GATAGCCATG TTTCGCTGGA TGTTGTGGAG GAGCTACGTT GGTTGGAATA TGGGCAACGC 
TTGCGTGATC AACGGCGTAA CCGTTTGACC TGTGAGCGGC AACCCGCCGT GGCGGATCTA 
TTGTACAGCC AAGCATTAGC CGGAGGGCGT CAGGCTTGCG GGCGTCAAAT TAGCCAGCTA 
GCCGTAGGCT ATCGTGCCGA TTGGTTAGTA CTCGATGGCG ATGATCCTTA TATTGCCGGG 
ACAAGATCGG CATCTTTGTT GAATAGATGG TTATTTGCGG GGGGTAAATC GCAAATTCGA 
GATGTTTATG TGGCAGGCAA GGCGGTAATC GTGGATAGAT ATCATCCATT GCAACAGCAA 
ACTGCGCAAG CTTTTCTGGC TGTACTGAAA GCCTGCCAAC AGGAGGTCTG A

Protein sequence

MPVYFTKRAF LPDGWAADVQ IAVDELGDIQ RISTGSSSSG CQVLSGPVLP GMPNLHSHAF 
QRMMSGLAEV AGDPQDSFWT WRDLMYRLVQ QLTPEQVGVI ARQLYIEMLK GGYTQVAEFH 
YLHHSPDGSP YNDIGEMTAQ LSQAAQDAGI GMTLLPVLYS YAGFGAQPAQ QGQSRFIQDT 
ESYLRQQQVI RRQLANQPLQ NQGLCFHSLR AVELSQMQQI LHVSDKQLPV HIHIAEQQKE 
VNDCLAWCGQ RPVAWLYGHL PVDSRWCLVH ATHLDTSELV MLANSQAVAG LCPTTEANLG 
DGIFPGVDYI HHQGRWGIGS DSHVSLDVVE ELRWLEYGQR LRDQRRNRLT CERQPAVADL 
LYSQALAGGR QACGRQISQL AVGYRADWLV LDGDDPYIAG TRSASLLNRW LFAGGKSQIR 
DVYVAGKAVI VDRYHPLQQQ TAQAFLAVLK ACQQEV