Gene YpAngola_A1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1201
Symbol	yedY
ID	5799666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	1250737
End bp	1251837
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	50%
IMG OID	641339172
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001605742
Protein GI	162418710
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.229043
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.403829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATAACA CGTTTACTCA TACTAAAAAC AATACTCATA CTAAAAACAA TACTCAGGCT 
AAAAACAGCG GTTCTCAGAC GAAAAGCAAT GCGGTCAGTC TCAATAAGCC ACGAAAACTG 
ACTGAGGCAG ATGTCACGCC AGAGAGTATT TTTTATCAAC GACGTAAGGT GTTGCAGGCT 
CTGGGGATCA CCGCCGCCAC CTTGGCTTTG CCAGCATCAG CACAAGCCGA TTTACTGGCC 
TGGTTTAAAG GTAACGAGCC GCCCAAAGCG CCCTCAGGTA AACCATTGAC GTTCACCCCA 
TCAGCCGCTT ACCACCCAGA CTTGGCTTTA ACGCCAGAAG ACAAAGTGAC CGGGTACAAT 
AATTTCTATG AGTTTGGGTT GGATAAAGCT GATCCCGCCG CGAATGCTGG CACGCTGAAA 
ACAGAGGACT GGCAGATTAA GATTGACGGC GATGTCGTTA AGCCCATGAC GTTGGATATG 
GATTATCTGA TGAAATGCTT TCCCCTTGAA GAGCGAATCT ATCGCCTACG CTGCGTCGAA 
GCGTGGTCGA TGGTCGTGCC ATGGATCGGT TTTGAGTTAG GGAAACTGCT GAAATTAGCA 
GAGCCAACCA GTAACGCCCG CTATGTGGCG TTCCAAACAT TGTATGCTCC AGATCAAATG 
CCTGGGCAGA AAAACCGCTT TATTGGCGGG GGACTGGACT ACCCCTATGT CGAAGGGCTG 
CGGTTGGATG AAGCCATGCA CCCGCTGGCC TTTATGGTTG TTGGCGTGTA TGGCAAAACC 
CTGCCACCAC AAAATGGTGC GCCACTACGA CTCATGACAC CGTGGAAATA TGGCTTTAAG 
AGCATTAAAT CCATCGTGCA TATTCGCCTG ACACGGGATC AGCCGCCAAC CACCTGGAAT 
TTGAGCGCCC CCAACGAATA TGGCTTTTAT GCCAATGTGA ACCCGCACGT CGATCACCCC 
CGCTGGTCAC AGGCCACCGA GCGCGTTATC GGTTCTGGCG GTATTCTGGA TGTAAAACGC 
CAGCCCACCC TGTTATTTAA CGGCTATGCT GAACAAGTGG CATCGCTATA TCGTGGTTTA 
GATTTGCGGA AGAATTTCTA A

Protein sequence

MHNTFTHTKN NTHTKNNTQA KNSGSQTKSN AVSLNKPRKL TEADVTPESI FYQRRKVLQA 
LGITAATLAL PASAQADLLA WFKGNEPPKA PSGKPLTFTP SAAYHPDLAL TPEDKVTGYN 
NFYEFGLDKA DPAANAGTLK TEDWQIKIDG DVVKPMTLDM DYLMKCFPLE ERIYRLRCVE 
AWSMVVPWIG FELGKLLKLA EPTSNARYVA FQTLYAPDQM PGQKNRFIGG GLDYPYVEGL 
RLDEAMHPLA FMVVGVYGKT LPPQNGAPLR LMTPWKYGFK SIKSIVHIRL TRDQPPTTWN 
LSAPNEYGFY ANVNPHVDHP RWSQATERVI GSGGILDVKR QPTLLFNGYA EQVASLYRGL 
DLRKNF