Gene YpAngola_A3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3332
Symbol
ID	5801809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3546863
End bp	3548023
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	53%
IMG OID	641341153
Product	putative aminotransferase
Protein accession	YP_001607675
Protein GI	162421729
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.816568
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTT TATCTTTTAT TCCAGACAGT AAATTGCCTG CGCAAGGCAC CACTATCTTC 
ACGCAAATGA GTGCATTGGC ACAAAAGCAC CAAGCGATCA ATTTGTCACA GGGCTTCCCT 
GATTTTGATG GGCCGGATTA CCTGAAGCAG CGGCTAGCCT ATCATGTCGA CCAAGGCGCA 
AACCAATATG CGCCGATGAT CGGCGTCGCA CCACTGCGTC ATGCTATCGC GGAGAAAACG 
GCTAATCTCT ACGGGTGGCG GCCCGATGCC GAGCACGAAG TGACCGTGAC CACCGGGGCC 
AGCGAAGCAC TATTTGCTGC CATCACCGCC CTCGTTCGTC CTGGTGATGA AGTGATCTGC 
CTTGACCCCA GCTACGACAG CTATGCACCG GCAGTCAAAC TGGCGGGTGG CGTCCTCAAG 
CGGATCACAC TAAAACCCCC TGCTTTTACC ACTGATTGGG CTGAATTTAC CCGTTTGGTC 
TCTGAACGCA CCCGTCTCGT TATCGTTTAT ACCCCCCATA ACCCGTCGGC TACCGTTTGG 
TGTGCAGAAG ATTTTGAACA GCTTTGGCAG GTCATTGCAG AACGCAATAT TTATGTTTTG 
AGTGATGAAG TTTACGAGCA CATCTGCTTT AGCCGTTCAG GTCATGCCAG TGTGTTGGCC 
CATCCGCAAC TGCGTCAGCG AGCGATTGCC GTTTCTTCGT TCGGCAAAAC CTTTCATATG 
ACGGGCTGGA AAGTGGGTTA TTGCATCGCA CCCGCCGCCA TCAGCGCCGA AGTGCGCAAA 
ATTCACCAAT ACCTGACCTT CTCCGTCTGC ACACCGGTCC AACTGGCATT GGCAGATATG 
CTTAATGCCG AGCCAGAACA CTGGCAGCAG TTGCCTGAAT TTTACCGTGC CCGCCGCGAT 
CGTTTCGTCA AGGCACTGGC AGCCAGTCGC CTGAAAATTC TGCCAAGCGA GGGGACCTAT 
TTCCTGTTGG CGGATTACAG CGGCATTTCA GATCTTGATG ATGTTGAGTT CTGTCAATGG 
CTCACCGAGC ACGTGGGCGT TGCTGCGATA CCGTTATCGG TCTTTTGTGA AGCTCCGTTC 
CCCCATAAAT TGATCCGGCT GTGCTTCGCC AAACAAGATG CCACGCTGGA CGCCGCCGCA 
GAGAGATTAT GTCAACTTTA A

Protein sequence

MSTLSFIPDS KLPAQGTTIF TQMSALAQKH QAINLSQGFP DFDGPDYLKQ RLAYHVDQGA 
NQYAPMIGVA PLRHAIAEKT ANLYGWRPDA EHEVTVTTGA SEALFAAITA LVRPGDEVIC 
LDPSYDSYAP AVKLAGGVLK RITLKPPAFT TDWAEFTRLV SERTRLVIVY TPHNPSATVW 
CAEDFEQLWQ VIAERNIYVL SDEVYEHICF SRSGHASVLA HPQLRQRAIA VSSFGKTFHM 
TGWKVGYCIA PAAISAEVRK IHQYLTFSVC TPVQLALADM LNAEPEHWQQ LPEFYRARRD 
RFVKALAASR LKILPSEGTY FLLADYSGIS DLDDVEFCQW LTEHVGVAAI PLSVFCEAPF 
PHKLIRLCFA KQDATLDAAA ERLCQL