Gene YpAngola_A4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A4049
Symbol
ID	5802528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	4307865
End bp	4308941
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	51%
IMG OID	641341833
Product	hypothetical protein
Protein accession	YP_001608340
Protein GI	162420587
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000497834
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGGTG TATTAGACCG CTATATCGGA CGGACTATCC TCAATACTAT CCTGATGACG 
TTATTAATGT TGGTGTCGCT GTCGGGCATC ATCAAGTTTG TCGATCAACT GCGTAAAGTC 
GGGCAGGGGG ACTACTCGGC GGCCTCTGCG GGTATGTACA CTATCCTGAG CATCCCAAAG 
GACATCGCGG TTTTCTTCCC GATGGCGGCC CTCTTAGGGG CATTACTGGG GCTTGGGACT 
TTAGCCAGTC GCAGTGAGTT GGTAGTTATG CAAGCGTCAG GTTTTACCCG GATGCAAATC 
GCAGCGTCAG TGATGAAAAC GGCAATCCCT CTGGTGTTGC TGACGATGGC TATCGGTGAG 
TGGGTGGCAC CGCAAGGTGA GCAGACCGCG CGTAATTTCC GGACACAGCA GATGTACGGT 
GGTTCGTTAC TCTCAACTCA GTCGGGTTTA TGGGCGAAAG ATGGCTCTGA CTTTATTTAT 
ATTCAGCGGG TGTCTGGCGA AAGCGAGTTG ACGGGTGTCA ATATTTATCA TTTTGATAAA 
GAAGATCGTC TGCTTTCGGT GCGGTATGCG GCGACGGCGA CCTATGAAAA AGACAATAAA 
ACCTGGCGGT TATCGCAGGT CGATGAATCT GATTTAAGTA ATCCTACTCA GGTGACAGGT 
TCACAGACGC TGACCGGCGA GTGGAAGACC AATCTGACGC CTGAGAAGTT GGGTGTGGTG 
GCGATGGATC CAGATTCGCT CTCCATTAGC GGGTTGCACG ACTACAGTAA ATATCTACAG 
CAAAGTGGCC AAGAGTCTAA CCGCTACGAA CTGAGTATGT GGAGCAAGGT ATTTGCTCCC 
TTCTCTGTTG CGGTCATGAT GCTGATGGCG CTGTCGTTTA TTTTTGGCCC ATTGCGCAGC 
GTGCCAATGG GTGTCCGGGT GGTCACCGGT ATTTTCTTCG GCTTTGTTTT CTACGTGCTG 
GATCAAGTTT TTGGTCGACT TAGCTTGGTT TATGGCATCC CACCAATGCT GGGTGCGCTG 
TTGCCGAGTA TGTTATTCCT CCTGATCAGC ATTTGTTTGC TGCTAAAACG GCGGTAA

Protein sequence

MFGVLDRYIG RTILNTILMT LLMLVSLSGI IKFVDQLRKV GQGDYSAASA GMYTILSIPK 
DIAVFFPMAA LLGALLGLGT LASRSELVVM QASGFTRMQI AASVMKTAIP LVLLTMAIGE 
WVAPQGEQTA RNFRTQQMYG GSLLSTQSGL WAKDGSDFIY IQRVSGESEL TGVNIYHFDK 
EDRLLSVRYA ATATYEKDNK TWRLSQVDES DLSNPTQVTG SQTLTGEWKT NLTPEKLGVV 
AMDPDSLSIS GLHDYSKYLQ QSGQESNRYE LSMWSKVFAP FSVAVMMLMA LSFIFGPLRS 
VPMGVRVVTG IFFGFVFYVL DQVFGRLSLV YGIPPMLGAL LPSMLFLLIS ICLLLKRR