Gene YpAngola_A2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2094
Symbol	ybtE
ID	5800564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	2169703
End bp	2171280
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	59%
IMG OID	641340006
Product	yersiniabactin synthetase, YbtE component
Protein accession	YP_001606552
Protein GI	162421769
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1021] Peptide arylation enzymes
TIGRFAM ID	[TIGR02275] 2,3-dihydroxybenzoate-AMP ligase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCTT CCTTTGAATC TCTGATTGAA CAGTATCCCT TACCCATTGC CGAACAGTTG 
CGCCACTGGG CGGCCCGTTA TGCCTCGCGA ATTGCCGTCG TTGATGCAAA GGGGTCGTTA 
ACCTACAGCG CGCTTGATGC ACAAGTTGAC GAACTTGCCG CAGGTCTGTC ATCACTGGGT 
TTGCGTTCGG GGGAGCATGT AATTGTGCAG CTTCCCAACG ACAACGCGTT TGTTACCCTG 
CTGTTCGCCT TGTTAAGACT GGGCGTTATC CCCGTGCTGG CGATGCCCTC GCAACGGGCG 
CTGGATATCG ACGCGCTGAT TGAGCTGGCG CAACCCGTCG CTTACGTTAT TCACGGGGAA 
AACCACGCAG AGCTGGCCCG ACAGATGGCG CACAAACACG CCTGCTTGCG TCATGTTCTG 
GTCGCTGGAG AGACCGTGAG CGACGATTTT ACGCCGCTCT TCTCCCTTCA CGGTGAGCGA 
CAGGCATGGC CGCAGCCTGA TGTTTCCGCC ACCGCGTTGT TGTTGCTCTC AGGCGGCACA 
ACCGGCACGC CCAAACTCAT CCCGCGCCGA CATGCCGACT ATAGCTATAA CTTCAGCGCT 
TCTGCTGAAC TGTGCGGCAT CAGCCAACAG AGCGTGTATC TCGCCGTCCT CCCGGTGGCG 
CATAACTTTC CGCTGGCCTG CCCCGGTATT CTGGGAACGC TTGCCTGCGG CGGAAAAGTG 
GTGCTGACCG ACAGCGCCAG CTGTGATGAG GTGATGCCTT TAATCGCGCA GGAAAGAGTG 
ACTCACGTCG CCCTGGTTCC GGCGCTGGCG CAATTATGGG TGCAGGCCAG GGAGTGGGAA 
GACAGCGACC TTTCGTCGCT GCGCGTCATT CAGGCAGGCG GCGCCCGGCT CGACCCGACG 
CTTGCTGAGC AGGTTATCGC CACCTTTGAC TGTACCCTGC AACAGGTTTT CGGTATGGCG 
GAAGGCCTGC TCTGTTTTAC CCGACTGGAC GATCCGCATG CCACCATTCT CCACAGCCAG 
GGGCGCCCGT TGTCCCCTCT GGATGAAATC CGCATCGTTG ATCAAGACGA GAACGACGTC 
GCGCCGGGCG AAACCGGGCA ATTGTTAACG CGCGGCCCTT ATACCATTTC GGGCTATTAC 
CGCGCCCCTG CCCACAACGC GCAGGCCTTT ACCGCGCAAG GGTTTTACCG CACAGGCGAC 
AATGTCAGGC TGGATGAGGT GGGGAACCTG CACGTTGAGG GACGCATAAA AGAGCAGATC 
AACCGCGCCG GAGAAAAAAT AGCCGCGGCT GAAGTGGAAT CGGCACTGCT GCGTTTAGCG 
GAAGTGCAAG ATTGCGCGGT GGTCGCCGCG CCGGACACGC TGCTTGGCGA GCGGATTTGC 
GCGTTTATCA TCGCGCAGCA GGTGCCAACT GACTATCAGC AGTTGCGTCA ACAACTGACC 
CGTATGGGGC TCAGCGCGTG GAAAATTCCT GACCAAATCG AGTTTCTGGA CCACTGGCCG 
CTCACCGCCG TCGGCAAGAT AGACAAAAAA CGCCTGACGG CTCTCGCCGT CGACCGTTAT 
CGCCATTCTG CCCAATAA

Protein sequence

MNSSFESLIE QYPLPIAEQL RHWAARYASR IAVVDAKGSL TYSALDAQVD ELAAGLSSLG 
LRSGEHVIVQ LPNDNAFVTL LFALLRLGVI PVLAMPSQRA LDIDALIELA QPVAYVIHGE 
NHAELARQMA HKHACLRHVL VAGETVSDDF TPLFSLHGER QAWPQPDVSA TALLLLSGGT 
TGTPKLIPRR HADYSYNFSA SAELCGISQQ SVYLAVLPVA HNFPLACPGI LGTLACGGKV 
VLTDSASCDE VMPLIAQERV THVALVPALA QLWVQAREWE DSDLSSLRVI QAGGARLDPT 
LAEQVIATFD CTLQQVFGMA EGLLCFTRLD DPHATILHSQ GRPLSPLDEI RIVDQDENDV 
APGETGQLLT RGPYTISGYY RAPAHNAQAF TAQGFYRTGD NVRLDEVGNL HVEGRIKEQI 
NRAGEKIAAA EVESALLRLA EVQDCAVVAA PDTLLGERIC AFIIAQQVPT DYQQLRQQLT 
RMGLSAWKIP DQIEFLDHWP LTAVGKIDKK RLTALAVDRY RHSAQ