Gene YpAngola_A2508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2508
Symbol
ID	5800978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2624441
End bp	2626045
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	46%
IMG OID	641340378
Product	chorismate-binding domain-containing protein
Protein accession	YP_001606921
Protein GI	162419062
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000325173
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCTGCT CTGGAGAACC GCTTTACTAT GCGCAGTGTC AACAAACGAT CTGTGCTCCC 
CCACTGACAA TGGCGACAAA ATTAGTCCAG CGTTATCAAG AGGGTGCCCG CAATATCTCT 
CACAGTAAAA GCGGCTCAGA AGGATATTCG TCACTCACTG ACAATGAAGA ATGGCAACCC 
TACGCTATCT ATGAAAAAGA CGGTGAGTTC TCGGTCGGTA TTGGGCTGGC GGCACTGATA 
ACTGCCTATC CTAATTATGT TCACATACGT TACCAGCAGC AAAATGCTCA TGGCGATAGC 
TTTAGCGGCG AACAATTTCA AGAGCGTGTT TGGTTATCCT CCGACATCGT CGGTAATATT 
TCATCCGCAC TGGCAAGTAT CCCGATTAAA GAGTGGCGAG CTTATGGTCT CAGCCAATTG 
GAATTGGTTC ATCTCTTCCA TAACCCGGCG TCTCACGCGG CCCCCGGTAC CGCACTACTG 
CAAATTTTCC TTCCGCTGCA TGAATATAGA CTCAATCGCG GCAGCGCTAT AATACGCAGT 
TTGCTTCCCT CTCACTTACC CCAACTGCTT ACGATGCTGC AGCAATGTGA CAGTGACCAA 
TATGACAACG CGCCCTCTAT CAACAAGTCA TCTATCTATA AATCATCTAG TTGTGAACCA 
TCTATTTATG AGCCATCTAT TTATGAACAA CCTGGCGATG AATATGATGA AAATAATCAA 
CGTGCCCATA AGCAAGACAG CCACCTGCAG ACACAAGTAG AAAGAAGCGC CATCGAAATG 
CAGATACGCC AAACTGACCC TACTATTTTC TGTGATCGGG TAGCAAAAAC CGTTAATGAA 
ATCAGGCAAG GTAAATATCA GAAAGCCATT TTATCGCGCC AGATACCGCT GCCAAATAAT 
ATTAATTTAC TCGCAAGCTA CCAACGTGGG CGCATAAATA ACACCTCGGC ACGTTCCTAT 
GCTTTCCGGA TGCAAGGATT TGAATTAATG GGCTTTAGCT CAAAGACTGC CGTGACTGTC 
TCAGCCAATG GCTGTCTGAT CACCCAACTT TTAACCGATA CACATGCACT GTCGTCAGAC 
CAAACTCAAT CGGTGCCACT TCATCATGAA TTACGAATTA ATACTAAAGA TATCACTGAA 
CATACCAGCT CAATCCTCTC TGTTGTTGCA ACGCTAACAC CAATCTGTGT ACCAGGCTCA 
GTTGCCATTG TTCCGTATAT GAAGGTGCTT ACTTGCGGTA AGGTGCAAAA TCTGGCCTCC 
TGTCTGCAAG GCCAGCTACA AAAAGGCATC AGCCACTGGC AAGCTATGCA ATCCCTGTAT 
CCTGTAGCTG CCGATATTCC TAAAGATCAT CTGATGCAAG CAACTCTTCA TGAACAGGGA 
TCATGGGAGG CCTATAGCAG CAGCGTGCTA ATGGTTGACA GCAATGGTGC ATTGGATGCG 
ACGCTAATTT CAGAGAGCCT TTCCCGTAAG AATAAAAGAT TTGGATTACG AGCCGGAACC 
GAAATCACCC ATCAAGCAGA CCCCCTACTC AAGCTAGAAG AGACTCATGA GACGCTGATC 
GCGATTGCCC GTTATCTGGT GTTGCAAACA GCAATGACCG ATTAA

Protein sequence

MPCSGEPLYY AQCQQTICAP PLTMATKLVQ RYQEGARNIS HSKSGSEGYS SLTDNEEWQP 
YAIYEKDGEF SVGIGLAALI TAYPNYVHIR YQQQNAHGDS FSGEQFQERV WLSSDIVGNI 
SSALASIPIK EWRAYGLSQL ELVHLFHNPA SHAAPGTALL QIFLPLHEYR LNRGSAIIRS 
LLPSHLPQLL TMLQQCDSDQ YDNAPSINKS SIYKSSSCEP SIYEPSIYEQ PGDEYDENNQ 
RAHKQDSHLQ TQVERSAIEM QIRQTDPTIF CDRVAKTVNE IRQGKYQKAI LSRQIPLPNN 
INLLASYQRG RINNTSARSY AFRMQGFELM GFSSKTAVTV SANGCLITQL LTDTHALSSD 
QTQSVPLHHE LRINTKDITE HTSSILSVVA TLTPICVPGS VAIVPYMKVL TCGKVQNLAS 
CLQGQLQKGI SHWQAMQSLY PVAADIPKDH LMQATLHEQG SWEAYSSSVL MVDSNGALDA 
TLISESLSRK NKRFGLRAGT EITHQADPLL KLEETHETLI AIARYLVLQT AMTD