Gene YpAngola_A2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2134
Symbol
ID	5800604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2231666
End bp	2233075
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	49%
IMG OID	641340042
Product	YHS domain-containing protein
Protein accession	YP_001606587
Protein GI	162418256
COG category	[S] Function unknown
COG ID	[COG4393] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.129693
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTATT TTTTCATATC CGTACTACAA GCCTTTTTAC CTGTGGCTCT GTTATTGGGG 
CTGAACTGGG TTGTTCGGCC AGCACCAGTA CTGAATCGGA TAGTGTGGAT AACCATACTG 
ATGGCCATCG TTGGCATCTG GATGGGTAAT TATTATCCAA AATCGCAACA GTGGCAGTTG 
GCATTGGCGG GGATTCAACT CCTTTCACTA CTGTTATTCT TATGTAGCCA ATTTATATGT 
CGGGTGTCAT TAGGCTATTT CTGGCAAGCA TTATTGGTCT TTGGTGCGGC ATTGAATTGG 
GGCAACAACC CCAATCTAGG GGCGCTCACT AATACCCATG TTATTAATAC TGATTTATTG 
CTCAATCTGG CTGCCACCGT GGTGGCATTT GGCTGGGTTA TATTCTGCGC CGTATTATTA 
TTGATGATGG TACGACAGTT GCCACGTTGT CGCGGACCCT TGCTGGTCGC ACTCACCCTG 
CTATTGATCT TGCCTATTAG CGGGGATGTC TTCCTGCTGC TTATGAAGTT ACACGTGGTG 
CCGCTAACCA AATCACTCCT TAGCTACGTG GCTCTGGTGA CCAACGGGCA TGCATGGCTT 
AACTATATTT GTGCCTTATT ATTAGCATTC ACGGTGCTGT GCTATTTGTG GCCGTGGAGC 
CGGTCCCGCC ATGTGGTCAG CCAAACGTCA GAAGCCATTG CCAAACGTAA AGCGCTGGCA 
GCGTACCGCA ATGTCCGGCG AATTTTGTTT TTATCGTTGC TGGCATTGGT GGTGGTCGCT 
GCGGCTCAGT TTTATTGGGA TAAAGTGGCC TCGCAACCTC CTCAGTTATC AGAAGCATTG 
CCCGTGACAC TGTCGTCTGA TGGGTTGGTC CATATCCCGG TTGAGCAAGT CCGAGATGGC 
AAACTACACC GCTTTGTCTG GATCGCTGAT GACGGCAAAG CCGTTCGCTT CTTTATTATC 
AACCGCTATC CAGACCGACT GCGCCTGAGT GTGGTCTTCG ACGCTTGCCT ATTGTGCGGC 
GACCAAGGTT ATGTCATGGA AGGTAATCAG GTCATTTGTG TTGCTTGCGC GGTACATATC 
TTCATTCCCT CCATCGGTAA AGCCGGTGGT TGTAACCCGA TACCTCTGGA AAATTGGCAG 
AGTGATGATA ACGAGTTGAT TATTCCCAGA GCGTCTTTGG CGGCGGGCGT CAATTACTTT 
ACGACGGTGG TCACACTGGA TGTCGTTGAT CCGGTTGATA AGAGCCATCT GACCAATCAA 
AAATCCGAGT ATAAATACAG CTATGGCGGG AAAACCTATT TCTTCTCCTC CGAGGCGAAT 
TACAACCGTT TCCGCGATCA CCCAGAACAG TTTGTCACGC CGGTAGCCGG CGAAGGTGAT 
GCCAGCGATG ATAGACAGGA GAACCCATAA

Protein sequence

MSYFFISVLQ AFLPVALLLG LNWVVRPAPV LNRIVWITIL MAIVGIWMGN YYPKSQQWQL 
ALAGIQLLSL LLFLCSQFIC RVSLGYFWQA LLVFGAALNW GNNPNLGALT NTHVINTDLL 
LNLAATVVAF GWVIFCAVLL LMMVRQLPRC RGPLLVALTL LLILPISGDV FLLLMKLHVV 
PLTKSLLSYV ALVTNGHAWL NYICALLLAF TVLCYLWPWS RSRHVVSQTS EAIAKRKALA 
AYRNVRRILF LSLLALVVVA AAQFYWDKVA SQPPQLSEAL PVTLSSDGLV HIPVEQVRDG 
KLHRFVWIAD DGKAVRFFII NRYPDRLRLS VVFDACLLCG DQGYVMEGNQ VICVACAVHI 
FIPSIGKAGG CNPIPLENWQ SDDNELIIPR ASLAAGVNYF TTVVTLDVVD PVDKSHLTNQ 
KSEYKYSYGG KTYFFSSEAN YNRFRDHPEQ FVTPVAGEGD ASDDRQENP