Gene YpAngola_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_0076
Symbol
ID	5798372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010158
Strand	+
Start bp	50960
End bp	52216
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	54%
IMG OID	641337971
Product	hypothetical protein
Protein accession	YP_001604588
Protein GI	162417876
COG category
COG ID
TIGRFAM ID	[TIGR01547] phage terminase, large subunit, PBSX family

Plasmid Coverage information

Num covering plasmid clones	476
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	619
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCC CGTCGTCTCT GAGTCTCGTA CAGCTGCATT CTGGGCAGAT GCAAGTCTTC 
CAGTCGCCAC ATCGTTTCAA AGTAGTGTGT GCGGGTCGAC GCTGGGGTAA ATCCCGGTTG 
TCGATTTCCA CCATCATTCG CGCGGCAGCC AAAGAGAAGA AGCAACGTGT CTGGTATGTC 
GCACCGACGT ACCAGATGGC TCGCCAGATC TTGTGGGATG ACCTGCAGGA AGTTCTGCCG 
CGTAAATGGG TTCGTAAGAA AAACGACACC ACGATGACCA TCGTGCTGAA GAACGGCTCT 
GAAATCGCGC TGAAAGGTGC GGATAAGCCC GATACGCTTC GTGGTGTGGC ACTGCACTTT 
GTGGTGCTCG ATGAATTTCA GGATATGAAG CCGGATACCT GGTACAAGGT ACTTCGTCCG 
ACACTGTCCT CAACCCGTGG CGGTGCGCTG ATCATCGGTA CGCCAAAAGG CTTCTCCGAG 
TTCCACAAGC TGTGGACTAT CGGTCAGAAC AAAGATTTGC AACGCAAAGG GCAGTGGAAG 
AGCTGGCAGT TCGTTACGGC CGATTCTCCG TTCGTACCGA GCGCGGAAAT CGAAGCGGCG 
AAGAACGATA TGGACCCTAA ATCGTTCGCA CAGGAATACC TGGCCAGCTT CGAAAACATG 
TCCGGACGCG TTTACTACCC GTTCGACCGC AATGTGCATG TGAAGCCACT CCAGTTCAAT 
CCGAAACTGC CGATCTGGGT TGGTCAGGAC TTCAACATCG ACCCTATGTC ATCGGTCATC 
CTGCAGCCGC AGCCAAATGG TGAGTTGTGG GCCGTGGACG AGGTTGTGCT GTTCTCTTCC 
AACACGGCTG AAGTGTGTGA TGAGCTGGAG CGCCGTTTCT GGCGCTGGAA GTCTCAGGTC 
ACTATCTTCC CTGACCCGGC TGGTGCGTAT CGCCAGCACG CACGCGGCGA ATCTGACGTC 
GATATATTCA AGGAAAAAGG TTTCCTCCGA GTCGATTATC CGAAGAAGCA CCCGCCTATC 
GCAGACCGTG TGAACGCCGT GAACCGGATG TTGATGAGTG CCTCGGGCGA AACCCGGTTG 
TACATCGATC CGAAGTGCAA ACATCTCATC GACTCGCTGG AGAAGGTGAT CTACAAGCCA 
GGCTCACGCG ATATGGATAA GACTGGCGGC ATCGAACACA GTGCGGATGC GTTGGGTTAT 
CCGGTTCATC GTAGGTATCC GGTGAAAAAT CGTGTTATTC TTGGTGGATC TAGATAA

Protein sequence

MAIPSSLSLV QLHSGQMQVF QSPHRFKVVC AGRRWGKSRL SISTIIRAAA KEKKQRVWYV 
APTYQMARQI LWDDLQEVLP RKWVRKKNDT TMTIVLKNGS EIALKGADKP DTLRGVALHF 
VVLDEFQDMK PDTWYKVLRP TLSSTRGGAL IIGTPKGFSE FHKLWTIGQN KDLQRKGQWK 
SWQFVTADSP FVPSAEIEAA KNDMDPKSFA QEYLASFENM SGRVYYPFDR NVHVKPLQFN 
PKLPIWVGQD FNIDPMSSVI LQPQPNGELW AVDEVVLFSS NTAEVCDELE RRFWRWKSQV 
TIFPDPAGAY RQHARGESDV DIFKEKGFLR VDYPKKHPPI ADRVNAVNRM LMSASGETRL 
YIDPKCKHLI DSLEKVIYKP GSRDMDKTGG IEHSADALGY PVHRRYPVKN RVILGGSR