Gene YpAngola_A1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1072
Symbol
ID	5799535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	1099760
End bp	1101139
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	48%
IMG OID	641339057
Product	hypothetical protein
Protein accession	YP_001605629
Protein GI	162419266
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAATA AAAGAAAAAT TGTCCTCGCC GCTATATTAC TCACGGTTAA CGGCGGCTTG 
TTCGCCCAGA GCGTCGTGAT TGATCAATTA AAAGTTTCTG AGCATCTTTA TCCAAAGGGA 
TTTGAATCCG AATTTCAGAA TAACCTCGAT TTCTATCGTG ACGGTGTTGG TGTCGATGAG 
AAGGCCAAAG TGCCTTACGA TACGATCCGT ATTGAAGGTA CTGAAATTGT TAAAGGTTAT 
TATACCAACA CCACCGAGGT GGGGTTGTAT CTCAATATAT TAACCGAGTC GGTAAAAGCC 
GGTAACCTGC AGGCGTTACA ACGAATTAAA GAGACATTAA CCACCTTGGA GCAGGCCCCC 
AAATGGAACG GGTTATTTTA CTGGCCCTAT GATATCCGCG ACGGCAAGCT GGTGACCAAT 
CCCGATGAAA TCGTACCTGC GGTGGATAAC GGTAATCTCT CGTTCGCACT GGCGGGGGTT 
GCGGGTGCAT TTCTAGATTC GAGCGATGCG GACAAGCAAG AGATCGTGCA ACGCATTGAG 
GCGATACTGG ACGGACAGAA ACCAGGCTGG GCCGCCCTGT ACGATGAAAA TAAAGGTCTG 
CTCTCCTCTG GTTGGTCGAC AAAAAACAAT GCGTCACTGG GCTACTTCGT TGATCGCAAG 
GGCAATGAAA GCCGTGCGGC GGTGGCCTGG GCGGTGCTGG CGACTAAAGA TATGGGAGCC 
AAAGCATTAC CGGTTAGCGC GTTCAGTAAA ATGGAGCTCT ACACCCAACG CTATGAAATA 
AACGGCAAGC AATACAACCC GCTGCTGACC TGGGATGGCG CTTATTTCCA GATGATGATG 
CCGCAAATAT GGCTGAATGA GCGTGAACTG ATGCCTAACT ACGGCATTGT CGAGGATCAC 
ACCTTTATTC AAAAAGTCTA TGCCAGCAAG CATGGCATTC CAATGGTTTC TTCCTCCGCT 
ACCACGGATA ACGCTTACCA CGCCTTCGGT GTGCCACAGC TTTCCGAGAG CAAAGTTCGC 
TTCAAGAATA AGATCGATGA TGGCTATACC GGTACGCCGC ACGCAATAGC GCTCTCCTAT 
ATCGTCGATC CTGCCGGAGC GATCAGCGCA TTAAAGAAAC TGAAACAGGC TTATCCGAAT 
ATCGAATCCC CGTATGGCTG GTATGACGCT GTCGATAGCA GCGGCAAGAT CTCAAAAAAT 
ATCCTTTCCC TTGATGTCGG CATGTTTGTT GGTGCTTTTC TGGCGAAAGA GATCAATGCC 
GATGTTGAAA AATACCTACA AAGCAAGGGC GATATGGAAT TGCTAAAAGA GATGTATCAG 
TCCTACGTTC CCAATAATTA CAAACCATTG GATGGTCTCT CCAGCTCTTC TCTGCACTGA

Protein sequence

MINKRKIVLA AILLTVNGGL FAQSVVIDQL KVSEHLYPKG FESEFQNNLD FYRDGVGVDE 
KAKVPYDTIR IEGTEIVKGY YTNTTEVGLY LNILTESVKA GNLQALQRIK ETLTTLEQAP 
KWNGLFYWPY DIRDGKLVTN PDEIVPAVDN GNLSFALAGV AGAFLDSSDA DKQEIVQRIE 
AILDGQKPGW AALYDENKGL LSSGWSTKNN ASLGYFVDRK GNESRAAVAW AVLATKDMGA 
KALPVSAFSK MELYTQRYEI NGKQYNPLLT WDGAYFQMMM PQIWLNEREL MPNYGIVEDH 
TFIQKVYASK HGIPMVSSSA TTDNAYHAFG VPQLSESKVR FKNKIDDGYT GTPHAIALSY 
IVDPAGAISA LKKLKQAYPN IESPYGWYDA VDSSGKISKN ILSLDVGMFV GAFLAKEINA 
DVEKYLQSKG DMELLKEMYQ SYVPNNYKPL DGLSSSSLH