Gene YpAngola_A3171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3171
Symbol	hisC
ID	5801646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3356505
End bp	3357653
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	641341004
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001607531
Protein GI	162420699
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.777037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAT CTAATAACGT CACGGACCTG GCCCGTGCCA ACATCCGTGC TCTGACTCCC 
TATATGTCCG CACGTCGGTT AGGCGGTAAT GGCGATGTCT GGCTGAATGC CAACGAATAT 
CCGCTGGGCA CTGAATATCA GTTGACCACG CAAACCTTCA ATCGCTATCC CGAGTGTCAG 
CCTAAGCACG TTATTGAGCG CTATGCCGCT TACGCCGGTT TACCGCCAGA GCAAGTACTG 
GTTAGTCGTG GTGCTGATGA AGGGATCGAA CTGCTGATCC GCGCGTTCTG TGAGCCGGGT 
CAGGATGCCA TTTTATTCTG CCCACCAACC TACGGCATGT ACGCTGTCAG TGCTGAAACC 
TTTGGTGTAG AACGGCGCAC CGTACCCGCT CAGGCTGACT GGCAGTTAGA TTTACCGGCC 
ATTGCCAACA ATCTGGAACA GGTAAAAGTG ATCTATGTTT GCAGCCCAAA TAACCCGACG 
GGTAATTTAA TCAACCCGGC TGATTTACAG GCGGTGCTGG CACTGGCGCA AGGCCGCGCG 
ATTGTCGCCA TCGACGAAGC CTATATTGAG TTTTGTCCAC AAGCATCGGT CAGTAATTGG 
CTAAAAGATT ATCCGAATTT AGTGATTTTG CGCACCTTAT CGAAAGCCTT TGCATTAGCG 
GGTTTACGTT GTGGCTTTAC GTTAGCCAAC AGCGATATCA TCCAATTGCT GCTTAAAGTG 
ATCGCCCCCT ATCCGTTATC TACGCCAGTG GCGGATATTG CCGCGCAAGC ACTCAGCCCA 
AAGGGGATTG AGCAAATGCG CCAACGGGTC AGTGAAGTAC GAGCTAACCG CGCATGGCTA 
CAATCCGCAC TGCAAGATTG CGCCTGTGTC GAACAGGTGT TCACCAGCGA AAGCAACTAT 
TTGCTGGCCC GCTTTACCGC GTCCAGCAGC GTATTCAACG CATTGTGGGA TCAGGGCATT 
ATTTTGCGTG ATCAAAATAA ACAACCGGGG TTAGCCAACT GCCTGCGCAT CACCATTGGC 
ACCCGTCAGG AGTGTGAGCG AGTGATTGCC GCCCTTGCCC CCCTGCCCGG CATTGATAAC 
TCAAATAACA TTGATAACCA GAATAAAACC TATTCTCAGA CCTCCAGCAT CCGTAAGGGA 
ACGATATGA

Protein sequence

MSQSNNVTDL ARANIRALTP YMSARRLGGN GDVWLNANEY PLGTEYQLTT QTFNRYPECQ 
PKHVIERYAA YAGLPPEQVL VSRGADEGIE LLIRAFCEPG QDAILFCPPT YGMYAVSAET 
FGVERRTVPA QADWQLDLPA IANNLEQVKV IYVCSPNNPT GNLINPADLQ AVLALAQGRA 
IVAIDEAYIE FCPQASVSNW LKDYPNLVIL RTLSKAFALA GLRCGFTLAN SDIIQLLLKV 
IAPYPLSTPV ADIAAQALSP KGIEQMRQRV SEVRANRAWL QSALQDCACV EQVFTSESNY 
LLARFTASSS VFNALWDQGI ILRDQNKQPG LANCLRITIG TRQECERVIA ALAPLPGIDN 
SNNIDNQNKT YSQTSSIRKG TI