Gene YpAngola_A1871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1871
Symbol
ID	5800342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	1936499
End bp	1937632
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	56%
IMG OID	641339803
Product	hypothetical protein
Protein accession	YP_001606358
Protein GI	162419831
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00529235
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGAAG TGCGTATTGG ATTGATTGGT ACCGGGTATA TCGGTAAGGC GCACGCCATT 
GCCTACGCAC AGGCACCGAC GGTGTTTGAA TTGCGCGGCA AACTGGTGCG CGAAATGGTG 
GCCGAAGTCT CACCAGCGCT GGCGGCACAG CGTGCGCAGG CTTTCGGTTT CAACCGGTTT 
ACCTGCGACT GGCGGGAGCT GGTCGCGGAT CCGGCTATTG ATGTGGTTGA TATTTGCTCA 
CCTAATTATC TACATAAAGA GATGGCGCTG GCGGCCATCC ACCACGGCAA ACATGTCTAT 
GCGGAGAAAC CGCTGGCGCT GAATGCCCGT GACGCCAGCG AGATGGCGGC GGCCGCAACG 
CGCGCTGGGG TGAAAACGTT GGTAGGGTTC AATTACATCA AAAACCCCAG TGCGAAGCTG 
GCTAAAGAGA TCATTGAACG TGGTGAAATC GGTGAGGTGA TCCACTTTTA TGGCACCCAT 
AACGAAGACT ATATGGCCGA TCCCAATACC CCTATTCACT GGCACTGTTT ACACGCGACG 
GCAGGGCTGG GAGCACTTGG CGATCTGGCG GCCCACATCG TCAGCATGGC GCAATATCTG 
GTGGGGGAAA TAACGCAGGT ATGCGGTGAT CTGAAAACCG TCGTGGTGAC ACGCCCGGCG 
AGCGTTGGCT CCAGCGCCAG AGTGGCGGTT GAAAACGAAG ATCAGGCCCA TGCCATGGTG 
CGTTTTGTGA ATGGCGCTCA GGGAGTGATT GAAGCCTCGC GGGTGGCTTG CGGGCGCAAA 
ATGGGCCTCT CTTACATGAT TACCGGTACT CAAGGGGCGA TCAGTTTTAC CCAAGAACGT 
ATGGCGGAAC TCAAACTCTA CCTGCACAAC GACCCGGTCA ACCGACAAGG CTTCCGTACC 
CTGCTCGTCG GCCCGGCGCA CCCAGAGTAT GCCGCGTTCT GTATGGCTGC GGGCCACGGT 
ATTGGTTTTA ACGATCAAAA AACCGTGGAA GTGCGTGACT TGATCGACGG CATCGCGATG 
GACACGCCGC TGTGGCCCGA TTTCGCCGAG GGCTGGAAAG TCTCACGCAT TCTCGATGCG 
ATTGCTCTGT CTCATCAGGA TAGCCGCTGG GTGAATGTGA CCGACATTGT CTGA

Protein sequence

MKEVRIGLIG TGYIGKAHAI AYAQAPTVFE LRGKLVREMV AEVSPALAAQ RAQAFGFNRF 
TCDWRELVAD PAIDVVDICS PNYLHKEMAL AAIHHGKHVY AEKPLALNAR DASEMAAAAT 
RAGVKTLVGF NYIKNPSAKL AKEIIERGEI GEVIHFYGTH NEDYMADPNT PIHWHCLHAT 
AGLGALGDLA AHIVSMAQYL VGEITQVCGD LKTVVVTRPA SVGSSARVAV ENEDQAHAMV 
RFVNGAQGVI EASRVACGRK MGLSYMITGT QGAISFTQER MAELKLYLHN DPVNRQGFRT 
LLVGPAHPEY AAFCMAAGHG IGFNDQKTVE VRDLIDGIAM DTPLWPDFAE GWKVSRILDA 
IALSHQDSRW VNVTDIV