Gene YpAngola_A2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2107
Symbol
ID	5800577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	2199113
End bp	2200390
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	48%
IMG OID	641340017
Product	hypothetical protein
Protein accession	YP_001606562
Protein GI	162421600
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0010339
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTGT TATCTTCACT GTGCCTGCTC GGTTTTACCT TACCCAGTCA GGCACAATGT 
GTCTGGAAAG GGAGTGATAT TGGCGGGGAT AACTACGGTG CCTCACTGTA TTTAGGCAAT 
ATCAATATCA CCAGTAATTA TATTCAACCC GTCGATTCAA TTTTGGCCTC TAACGTCATC 
AGCTTAGTGC CCGCCCATCG GTGGCCAGAT CCAGAAGCCG TTATCTATGA ATGTGACATC 
GCCGATAAAG ACAGCTTATT TGAAGTGTTT GCTACCAATG GTGACAGCAA TGTTGGCGGC 
TACACCCATA TGGGTGATAA CTATTTTCAA ACGTTTTTCC CTTATACCGC GCTGAAACTG 
ATTCATGTCG ATTCAGGTGT TGAATTCACC CGTATCTGGC AAGAAATCCC ATTAAAAAAG 
TACGATATCC TTGACAATAA AATCCAGATA AAAGGTAAAC ACTTCAGCCA GATCCGCGCA 
GAGTTGAAAA AAACAGGCTC AGTAGATCGC TCACCCGGCC CGACCAGTTG GGGTTGCCCT 
GGACCGGCGG AGGACAACTA CTCAGGCGGC TATACCTGTA ATCAACCTAA TGGTTATGTG 
GTATTCAAAG GACCCGGCAT GGCGGTGCCA GAAGCAGGAT ATGATTCAGC GACGAATTAC 
CAAACTTGGG GAACGGGCCG CTATATGGCA TTTGGCATGA ACACATCCCC CATCACTATC 
CTGACGCGTA AAAATACCTG TGTAGTACGC AATGTGACGC CTTATGTAGT TTTCCCGATC 
ATTACAGTGA ATGAACTTAA TGATAACCAA ACACGTAGTG CTGAAATCAC AGTAGATATC 
GAGTGTCAGT CAGGTACCGA ATCAGGGACA TCCAGTGGCC AAACCGCCAT TGGGATCCAA 
ACCTCATTAC CGGGCTACCT TAAAGCGCTG GGATTAGGAT TGGTGAATAC GGCAGGAGGA 
GTGAGTTACT TGCTCTCAGA CAGTTACGGT ACTGATAGCC GTATCGCCAC TGGCGTGGGT 
ATCAGCCTAA GCGATAGCAA TGGCAGTACC ATGAATTTTG TTGGTTGGGG AGGATGTGCA 
CAGACTCAGG ACTGTCTAAC TACCGCCGAT GCGGGCTGGT ACCCGATACT CACTGGGGCC 
AGTGGTAATG GCAGCCACTC TGCAGGTTAC AACAATTATG TCCATCACTT CACCGCCACC 
TTAAAAAAAC TGCCTAATGG TCACCCTACT GCGGGGAAGA TCGACGCCAC AGCTTACGTT 
CTGGTGAAAA TACAATGA

Protein sequence

MSVLSSLCLL GFTLPSQAQC VWKGSDIGGD NYGASLYLGN INITSNYIQP VDSILASNVI 
SLVPAHRWPD PEAVIYECDI ADKDSLFEVF ATNGDSNVGG YTHMGDNYFQ TFFPYTALKL 
IHVDSGVEFT RIWQEIPLKK YDILDNKIQI KGKHFSQIRA ELKKTGSVDR SPGPTSWGCP 
GPAEDNYSGG YTCNQPNGYV VFKGPGMAVP EAGYDSATNY QTWGTGRYMA FGMNTSPITI 
LTRKNTCVVR NVTPYVVFPI ITVNELNDNQ TRSAEITVDI ECQSGTESGT SSGQTAIGIQ 
TSLPGYLKAL GLGLVNTAGG VSYLLSDSYG TDSRIATGVG ISLSDSNGST MNFVGWGGCA 
QTQDCLTTAD AGWYPILTGA SGNGSHSAGY NNYVHHFTAT LKKLPNGHPT AGKIDATAYV 
LVKIQ