Gene YpAngola_A1469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1469
Symbol
ID	5799937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	1521101
End bp	1522507
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	55%
IMG OID	641339423
Product	putative DNA circulation protein
Protein accession	YP_001605984
Protein GI	162420197
COG category	[R] General function prediction only
COG ID	[COG4228] Mu-like prophage DNA circulation protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.539442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTCA TTGGCAACAC ATTATCAGCG TTATTGGGAG GCAGTGACGA CAGCTGGCAA 
TGGTCGGAAC ACCTTCATCG AGCCTCCTTT CGTGGCGTTC CCTTTGTGGT CGTCAGTGGG 
CAAGGTACCT TTGGTCGCCG CCAGGTAACA CACAGCTACC CCTATCGCGA TACCAGCTAT 
ATCGAAGATT TGGGCCGCAA TACGCGCAAA ATTGTTCTGA AAGGGATTTT GATACAAAAC 
AGCCAGATCT ATACCGCACC TGATGTGATG ACTCAACGTG ACTCATTGAT TGCGGCTTGT 
GAAATGTCGG GGCCGGGCAC TCTGGTCCAC CCGACACTGG GGGAAATGAC GGTCAGCATT 
TCCGAGGCAG GGCTATTGAT CGATGATAGC TTCAGCAGTG AGCGGGTCTT TTCCTTTACC 
TTAACCGCCA TCGAGTCTGG CCTGCGTGCC TTTGCTATTA CTGGCTCCGC AGAAATGGGC 
GCATCCATTC AGTCCTCCTG GCTAGGGCTA AGTGCTAAAG CGGTTGCGGG CTTTATCTCA 
ACGGTGAAAG GCGAAATGCG CTCAGCGACT CAGGCGATAA AAACTCTGAA AAATACCGCT 
GCATTCTGGC GTCGGATGGT GACGGGCACG GCCAACGAAG CCAGTAATTT GGGCAACGCC 
CTACGCTCAA CCTTTGGTCG CAACCGCTAT GGCCGCTATA ACCACGGCAC TGTCGGAGGC 
AGCAGCACGG GAGCGACAAC GACGGTTAGC CAACAAAATG ACACGGCGGA TTTATCCACG 
CTGGTGGCGC AACGGATGGC ACTGGTGGTT GAAGGACGGG CGGCGCTCGA CGCGGCGTTG 
GACGAGTTAC TCGCCGCCAG CAGTATTGAA AGCCATGCCG ACAGTGTGCT GGCCGTGGTC 
GATGCCCTGC TGGCGACGGG CATCAGTACG CGGGATATTA TCCGTATCAT GGAAACCCTG 
GCGCTAGCCC ATGACGATAC TTTCCGTGCC AACGACAGTG ATAGGGCCGT CGCGGATGCC 
AGCCACCACT TAATGGCCAC ATTATGCACT GGGGCGATGA TCCAAGTGGC AGCGCAATAT 
CAACCGGAAA GCTATGACGA TGCGGTTGCG GTATTGGGCC GGGTTTGCCT GGTGATTGAC 
AATACTGCAC TGGTCGCCGC CGACAGGGGG AATGATGAGA CCTATCGTGC GCTGGTGCAG 
ATGCGTGAAT CTATCGTGAC CGTGCTACAG CAGGCGGGGG CCAATCTATC ACGGGTTGGC 
GAGGTCAGTT TTAACCGTTC ACTACCGGCT TTGATGCTGG CAAACCGCCT CTATCAGGAT 
GCGTTACGCG GCGATTCGCT GGTGAAAATG GCTAATCCTA TTCACCCGGC ATTTATGCCC 
ATCCGATTTA AGGCGCTGAA TCTATGA

Protein sequence

MSLIGNTLSA LLGGSDDSWQ WSEHLHRASF RGVPFVVVSG QGTFGRRQVT HSYPYRDTSY 
IEDLGRNTRK IVLKGILIQN SQIYTAPDVM TQRDSLIAAC EMSGPGTLVH PTLGEMTVSI 
SEAGLLIDDS FSSERVFSFT LTAIESGLRA FAITGSAEMG ASIQSSWLGL SAKAVAGFIS 
TVKGEMRSAT QAIKTLKNTA AFWRRMVTGT ANEASNLGNA LRSTFGRNRY GRYNHGTVGG 
SSTGATTTVS QQNDTADLST LVAQRMALVV EGRAALDAAL DELLAASSIE SHADSVLAVV 
DALLATGIST RDIIRIMETL ALAHDDTFRA NDSDRAVADA SHHLMATLCT GAMIQVAAQY 
QPESYDDAVA VLGRVCLVID NTALVAADRG NDETYRALVQ MRESIVTVLQ QAGANLSRVG 
EVSFNRSLPA LMLANRLYQD ALRGDSLVKM ANPIHPAFMP IRFKALNL