Gene YpAngola_A2499 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2499
Symbol
ID	5800969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	2615292
End bp	2616479
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	51%
IMG OID	641340372
Product	UDP-glycosyltransferase family protein
Protein accession	YP_001606915
Protein GI	162418393
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.892944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0000540048
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACGT TAGATGATTT GATCCCCCCG GCTACCCGCT GTATCGATCT GCTGGCCCCG 
CCTTTTTCTG GGCACTTACA CCCGATACTG GCGTTGGGCC GCATGTTGGC TAAAAATTAC 
GAGGTACGCA TCATCAGCAC GCAAGATGCG TTGGCGCGTA TCACGGCGGC AGGGCTAAAG 
GGCATTGCTT TGCCGGGTGA ATATGACCCG CTGTTACAGG CAATTGCCAA CCCAGACTAT 
GCGGTTAAAA GCAGTCCGCT GAAGCTTTAT CGCCAATTTA AATCTGCGGT TGGGTTACTC 
GTCGAGTTTG CCTCGGCACT GGAAAAACTT TATCAACATG ATGGTGCGCC AGACCTGGTT 
ATTGCTGACT TTACTTTACC CGTGGTAGGG ACGGTGAGTA AAAAATTGGG CATCCCTTGG 
TGGACGAGTT TACCCTCACC CTGTGTGCTG GAAACGTTAG ACGGCCCACC GGCCTATTGC 
GGTGGCCTTT ATCCAGCGAA AACTGCTATG GATAACGTCA GTCAGTTTAT CGCGCGGAAA 
AAAGTCCGTT GGTTTAAAAA AACGCTTTTT TGGTTATTCC GTAGAACAAT CTCAACAACC 
GGGATCACGG CGTTATATCG CGCCGATGGT ACAGAAAGTG CTTATTCAGC AGACTGTATT 
CTGGCTCTGG GTGATGTCGC ATTTGAATTT ACCCGAACCT GGCCGGAGAG CGTCCATTTT 
ATTGGGCCAG CGCTCTATAC ACCGCCTAAT TTGCAGCCTG CGCCGCACTT TGAAGCAGGT 
CGCCGCCATG TGCTGGTGAC CTTAGGGACT CATCTGGCCT GGCATAAAGA TGAAGTGGTA 
AAGGCGGTTG AGAGACTTGC CCGAACCATG CCAGAGTCAG TTTTTCATTT CACAGAGGGG 
GATCCGAACG CGGCTTGCCA TCAGCAGACC GATAATTTCA TCCGCTTGCC ATGGATAGAT 
TATGAAACCT GTCTTGGTCA CTACGATGTG GTGATTCATC ATGGTGGTGC AGGAATTCTG 
TATTACTGTC TGAAACATAA TATACCGGCG TTGGTCTATC CGGTTGATTT CGATCAATTT 
GACCATGCTG CCCGCCTTGA TGCGTCGGGG AAAGGTCTTT GGTTAAAAGG GGGGCTGAGC 
GCGTTGGCGA ATGCCAAAAC TCAGATTGAG CAGTTAACTG CCCGTTAG

Protein sequence

MKTLDDLIPP ATRCIDLLAP PFSGHLHPIL ALGRMLAKNY EVRIISTQDA LARITAAGLK 
GIALPGEYDP LLQAIANPDY AVKSSPLKLY RQFKSAVGLL VEFASALEKL YQHDGAPDLV 
IADFTLPVVG TVSKKLGIPW WTSLPSPCVL ETLDGPPAYC GGLYPAKTAM DNVSQFIARK 
KVRWFKKTLF WLFRRTISTT GITALYRADG TESAYSADCI LALGDVAFEF TRTWPESVHF 
IGPALYTPPN LQPAPHFEAG RRHVLVTLGT HLAWHKDEVV KAVERLARTM PESVFHFTEG 
DPNAACHQQT DNFIRLPWID YETCLGHYDV VIHHGGAGIL YYCLKHNIPA LVYPVDFDQF 
DHAARLDASG KGLWLKGGLS ALANAKTQIE QLTAR