Gene YpAngola_A1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1089
Symbol
ID	5799552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	1121473
End bp	1122513
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	641339067
Product	putative tellurium resistance protein
Protein accession	YP_001605639
Protein GI	162419629
COG category	[R] General function prediction only
COG ID	[COG4245] Uncharacterized protein encoded in toxicity protection region of plasmid R478, contains von Willebrand factor (vWF) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAGAC TGCCTATTTT CTTTGTTCTG GACTGCTCAG AATCGATGAT CGGGGAAAAT 
CTGAAGAAAA TGAACGATGG TCTGCAAATG ATCATCAATG ACCTTAAAAA GGATCCTCAC 
GCGCTTGAGA CCGCCTGGAT TTCCGTCATT GCCTTTGCCG GTGTCGCTAA AACGATTGTT 
CCTCTGGTAG AGGTTGTCTC ATTTTATCCA CCTCGACTAC CCATTGGGGG AGGAACCAGC 
CTGGGGGCGG CTCTGCAGGA GTTAACCCGC CAGATTGATA CTCAGGTCAG AAAAACCACG 
GAAGAGCGCA AAGGCGACTG GAAACCCGTG GTCTATTTGT TGACCGATGG GCGTCCAACG 
GATGATACCA CCGCCGAGAT AACGCGCTGG AAAACGCATT ACGCCCGTAA AGTGAACCTA 
ATCGCCATTG GGCTTGGCCC TTCTGCGGAT CTGAACATTC TCCGGCAACT GACAGAGAAC 
GTGTTGCTGT TCAATGATAC CCAAGAGGGC GATTTCACTC AGTTTATTAA GTGGATCACC 
GCGTCGGTCT CGGCACACAG CCGCAGCGTG GGCGAGGAAT CCCCTCCACT GTTGAATCAA 
ACCGACTACA TCGTCAAACT AGCAAAAGAT GATGTCGCCA GAGCCTATGA TGAAAACTGC 
GTCACACTGA TTGGCCGCTG TAGCAAATCC CGTCGGCCCT ATATCATTAA ATATGAACGC 
CCAGCGGTTA ACCTTTCCTC ACTCAATTTC AAACTCAACA TTAACGGATT TAACCTTGCG 
GGGTGCCTGC CGATTGATGA GGATTATTTT GCCTGGAGTG ATGAGTCTGT GTCATCGCAG 
CAGGTGAATA CCAGCGAACT GCATGGCACA CCTGGTTGCC CACATTGCGG CAACGGCAGT 
GCATTTGCCA TGTGTAACTG CGGTAAATTG CTCTGTATCA ATGGCGCGGA TGATGTTATC 
TGCCCGTGGT GTGATAGAGG GCTGACCTTT AATGTGGATG GGGGCGGATC TGACTTCGAT 
GTTATCCGGG GGAGAGGCTA A

Protein sequence

MRRLPIFFVL DCSESMIGEN LKKMNDGLQM IINDLKKDPH ALETAWISVI AFAGVAKTIV 
PLVEVVSFYP PRLPIGGGTS LGAALQELTR QIDTQVRKTT EERKGDWKPV VYLLTDGRPT 
DDTTAEITRW KTHYARKVNL IAIGLGPSAD LNILRQLTEN VLLFNDTQEG DFTQFIKWIT 
ASVSAHSRSV GEESPPLLNQ TDYIVKLAKD DVARAYDENC VTLIGRCSKS RRPYIIKYER 
PAVNLSSLNF KLNINGFNLA GCLPIDEDYF AWSDESVSSQ QVNTSELHGT PGCPHCGNGS 
AFAMCNCGKL LCINGADDVI CPWCDRGLTF NVDGGGSDFD VIRGRG