Gene YpAngola_A3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3043
Symbol
ID	5801516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3215708
End bp	3216748
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	47%
IMG OID	641340880
Product	pyridoxal-phosphate dependent enzyme
Protein accession	YP_001607409
Protein GI	162420281
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATA CATGGGTGAA AAATGCTATC AATGAAATAG AAGCTGACTT TCAACGCTCC 
GCTGATACGC ATTTAATTCG CTTAAATTTA TCAGCTTTTC CAGGTATTTA TCTGTATTTA 
AAAGATGAAA GTACCCACCC AACAGGCAGT TTGAAACACC GCTTGGCGCG TTCACTGTTT 
TTATATGGCT TATGCAATGG CTGGATAACC GAAGGGACGA CCATTATTGA AGCTTCATCG 
GGGAGTACTG CGGTCTCGGA AGCCTACTTT GCTCGCCTGA TCGGCCTGCC ATTTATCGCT 
GTCATGCCAA GTGGTACCAC GCGACGTAAA GTTGAACAAA TCACCTTCTA CGGTGGCCGT 
TGCCATTTTG TCGATCATGC AGGACAAATT TATGCCGCAT CGGAACAACT GGCCCGTGAT 
TTGAACGGTC ACTATATGGA TCAGTTTACT TATGCGGAAC GGGCAACCGA TTGGCGCGGC 
AATAACAATA TTGCAGACAG CATTTTCCGT CAAATGGCAC GGGAGCCTTT CCCAACCCCA 
GATTATATTG TGATGAGCGC AGGGACCGGT GGCACCTCAG CAACCTTAGG CCGTTATATC 
CGTTATCAAG GACATGACAC TCAGTTGGTG GTGGTCGACC CGGAAAACTC GGTATTTTAT 
GATTGCTTCT GTACCCGTGA CCGCACCGTC ACGGGCCGTT GTGGTAGCCG TATTGAAGGG 
ATAGGCCGTC CACGTGCTGA GCCTTCTTTT ATTCCAGAAG TGATTGATAG CATGCTACGC 
GTACCTGATG CTGCCAGTAT CGCCACTCTT CATTGGCTGG AGAGTATTCT TAGCCGTAAA 
GTGGGAGCCT CAACGGGTAC CAATGTCTGG GGTGCATTGC AATTGGCAAA ACAGATGCGT 
GAACAAGGCA AATCTGGCGC CATCGTGACA TTGCTCTGTG ACAGTGGTGA ACGTTATCTT 
GATACCTATT ATAACGAGGA ATGGGTCAGC AATAACATTG GGGATTTAAC ACCATTTACC 
AATGAATTGA ATAATCTGTA G

Protein sequence

MTNTWVKNAI NEIEADFQRS ADTHLIRLNL SAFPGIYLYL KDESTHPTGS LKHRLARSLF 
LYGLCNGWIT EGTTIIEASS GSTAVSEAYF ARLIGLPFIA VMPSGTTRRK VEQITFYGGR 
CHFVDHAGQI YAASEQLARD LNGHYMDQFT YAERATDWRG NNNIADSIFR QMAREPFPTP 
DYIVMSAGTG GTSATLGRYI RYQGHDTQLV VVDPENSVFY DCFCTRDRTV TGRCGSRIEG 
IGRPRAEPSF IPEVIDSMLR VPDAASIATL HWLESILSRK VGASTGTNVW GALQLAKQMR 
EQGKSGAIVT LLCDSGERYL DTYYNEEWVS NNIGDLTPFT NELNNL