Gene YpAngola_A2126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2126
Symbol
ID	5800596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2219788
End bp	2220948
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	47%
IMG OID	641340035
Product	aminotransferase, class I and II
Protein accession	YP_001606580
Protein GI	162420764
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.375573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0326129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAA TTATAACGGA TCAGCGTCAC CAATTTTCCT CACGAGTGAA TGACCTTCAC 
CCGTCGCCAA TTAGGGAAAT ACTGTCTGTC ATTGATCGTC CGGGAATGAT CTCGTTTGCC 
GGCGGATTAC CCGCAGTAGA AAGTTTTCCT CATATGAGCC TTGAGGGAAT GCCGCAGCCG 
ATGCTACAAT ATGGCGCGAG TGAAGGGGAG CTGGAATTAC GTCAACAGAT TGCTCAAAAT 
TTGTGTGAGC GAGGTTTATC CTGTACTGAG GAACAAGTCC TGATTATTTC AGGCTCACAG 
CAGGGCATTG ATCTGGTCGC TAAGTTGTTT ATTGACGAGG GAACCCCCGT CGCCGTTGAA 
TCGCCTACCT ATCTGGCTGC GTTACAGGTA TTCCGTTTTT TCGGTGCTCA ATTTGTGGCT 
TATGATTCAA CTCAGCCTGA TATCGACAAG CTTCGCACCG AAAAACCTGC TTTTGCTTAT 
ACTATTCCGA CCTTCCAGAA TCCAAGCGGT CACTGCCTTG ATACTGAACA ACGAGAGTTA 
CTGGCGAAGA CATGTGATGA CATTATGTTA CCGCTCTTTG AAGATGACCC GTACCATGAC 
TTGGTTTATG ACCCTTGTGA GCGTAAGCCA GTGTGTGCTT CATTACAGCG AGCTTCGTGG 
ATTTACCAAG GATCTTTTTC TAAAAGTTTA TCCCCGGCGC TGCGTTTGGG CTATCTTGTC 
GCATCTTCAG AATTGATTCC CTATTTGACA CGTTTAAAAC AAGCCGCAGA TTTGCACAGC 
AGCCGGATCA GCCAATGGTT AGTGTTACAG CAGTTGCGTA GCCCTAGGCA TACTGAGCAT 
ATGCATGAAC TGGCAGCCTA TTATCGAACT CGCCGTGATG CGTTTGAAAT CTCCCTACAA 
CGCCATTTTG GCTCTCTTGC GACGTGGAAA AAACCGGCTG GAGGGCTGTT CTTCTGGTTA 
ACCCTTAATC GCTGCATAGA TACTCGTCAA CTCTTGCCTA AAGCGCTGGC AAGCAATATT 
GCATTTATGC CCGGAGAGTC GTTCCTCCCT CATTCATCTG AAGGCTGCGG TCAGTTACGG 
CTTAATTTTA GCCATGCGAC GGAAGAACAA GCGGATGTAG GGCTGAAAAT ATTAGCGGGT 
TTAGTGCAGG AACATGCATA A

Protein sequence

MNKIITDQRH QFSSRVNDLH PSPIREILSV IDRPGMISFA GGLPAVESFP HMSLEGMPQP 
MLQYGASEGE LELRQQIAQN LCERGLSCTE EQVLIISGSQ QGIDLVAKLF IDEGTPVAVE 
SPTYLAALQV FRFFGAQFVA YDSTQPDIDK LRTEKPAFAY TIPTFQNPSG HCLDTEQREL 
LAKTCDDIML PLFEDDPYHD LVYDPCERKP VCASLQRASW IYQGSFSKSL SPALRLGYLV 
ASSELIPYLT RLKQAADLHS SRISQWLVLQ QLRSPRHTEH MHELAAYYRT RRDAFEISLQ 
RHFGSLATWK KPAGGLFFWL TLNRCIDTRQ LLPKALASNI AFMPGESFLP HSSEGCGQLR 
LNFSHATEEQ ADVGLKILAG LVQEHA