Gene YpAngola_A2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2041
Symbol
ID	5800511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2129044
End bp	2130174
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	641339961
Product	hypothetical protein
Protein accession	YP_001606511
Protein GI	162418186
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2822] Predicted periplasmic lipoprotein involved in iron transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.117906
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATTT GGTTCTTCCG TCGCACAGCG TTACACGCCG CGTTGTTGTC TCTGCCTGTT 
TTCGCTATCA GCGCACAGGC TGCTGATATT CAACAGGTTA AAATCACTGT CAATGATAAA 
CAATGTGAGC CAATGGCACT GACGGTTCCT GCCGGCAAAA CACAGTTTAT TGTGCACAAT 
GTTAGCCAGA AAGGACTGGA GTGGGAGATT TTAAAAGGGG TAATGGTGGT GGAGGAGCGT 
GAGAATATCG CGCCAGGTTT TACCCAAAAA ATGACGGCGA ATCTGGAACC TGGTGAATAT 
GATATGACCT GCGGCTTGTT AAGTAATCCG AAAGGTAAAT TAACTGTAAC TGTGGCAGCA 
GGTGAACAAG CCCCGGTGAA ACCCGATGCG ATGGCATTAG TCGGCCCGAT TGCTGAATAT 
AAGGTTTATG TCACACAAGA AGTGGCTCAG TTAGTCAGCC AAACCAAAGC GTTCACCGAT 
GCAGTGAAGG CTGGGGATCT GGCACTGGCA CGTAAATTGT ATGCGCCGAC TCGCCAGCAT 
TATGAGCGTA TCGAACCGAT TGCCGAACTG TTCTCTGATT TGGACGGCAG TATTGATGCC 
CGTGAAGATG ATTTTGAACA GAAATCGGCA GACCCTAAAT TTACCGGTTT CCACCGTTTA 
GAAAAAATCC TGTTTGGAGA TAACACAACC AAAGGTGCAG ATAAGTTTGC AGACCTGTTG 
TATCAGGACA CATTGGAACT GCAAAAACGC ATTGCTGGTC TGACATTTGC GCCTAATAAA 
GTGGTGGGAG GGGCGGCAGG GTTAATTGAG GAAGTCGCAG CCAGTAAAAT TAGCGGGGAA 
GAAGACCGCT ATAGCCGTAC CGATTTGTGG GATTTTCAAG CCAACGTCGA TGGCGCACAG 
AAAATTGTCA ATCTCCTGAG GCCATTACTG GAAAAAGCAG ATAAACCATT ACTGCAAAAA 
ATTGATGCGA ATTTTAACAC GGTTGATAGC GTGCTGGCGA AATATCGTAC CAAAGAGGGT 
TATGAATCCT ACGAGAAGCT AACCGATGCG GATCGTAATG CGATGAAAGG ACCAATCACT 
GCTCTGGCGG AAGACCTTGC TCAACTGCGT GGTGTATTAG GTCTGGATTG A

Protein sequence

MSIWFFRRTA LHAALLSLPV FAISAQAADI QQVKITVNDK QCEPMALTVP AGKTQFIVHN 
VSQKGLEWEI LKGVMVVEER ENIAPGFTQK MTANLEPGEY DMTCGLLSNP KGKLTVTVAA 
GEQAPVKPDA MALVGPIAEY KVYVTQEVAQ LVSQTKAFTD AVKAGDLALA RKLYAPTRQH 
YERIEPIAEL FSDLDGSIDA REDDFEQKSA DPKFTGFHRL EKILFGDNTT KGADKFADLL 
YQDTLELQKR IAGLTFAPNK VVGGAAGLIE EVAASKISGE EDRYSRTDLW DFQANVDGAQ 
KIVNLLRPLL EKADKPLLQK IDANFNTVDS VLAKYRTKEG YESYEKLTDA DRNAMKGPIT 
ALAEDLAQLR GVLGLD