Gene YpAngola_A3517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3517
Symbol
ID	5801993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3739531
End bp	3741141
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	51%
IMG OID	641341333
Product	methyl-accepting chemotaxis protein
Protein accession	YP_001607846
Protein GI	162420334
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.549342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGGTC AAATCCGGAT TTCTACCAGT TTTTTCCTGC TGCTGATGTT TCTTTGCGCC 
ATACAGTTAA TTTCAAGTGG TCTATCATTT ACGGCTTTTC GCTCAGACTA CCAAAATTTA 
AATCGAGTGG AGTTAAGTAG TCAGCAACGC GATGCATTAA GCCTCAGTTG GGTATCTTTG 
CTTCAGGCAC GTAATACCTT AAACCGTGCG GCTACTCGCT CGGCGCTCAA TGTTCCTCAG 
GAGCAAGTTA ACGCTTTAAT GGGGAGTGCG CGCAGTGCAT TGCAGAAAGC TGAACTTTAC 
TTTAATCAGT TTCAGGCGGT ACCGCGCCTT GATGAGAGTG AGAGCAGTGG GCAATTACTG 
GATGCGACCA AAAACAGTTA TCAAAACCTT CGTAGCGCAT TACGTGAGTT AATTGATTTT 
CTGGAAGCGG GTGATTTACA AGCATTTATG GATCAACCCA CTCAGAAAAC GCAAGATTTG 
TTTGAAGCGG ATTTCATCCA GTATTTGCAA TACGCCAATG AGGTTATTGC CGATGCCGGT 
CAGCAGAATC AGCAGGCTTA TCAGCTCTCA ATCTGGATAT TTAGTGGTGC GATTCTGATG 
GTTATCACGA TGGCCATTTC GTCGTTGATC TGGTTGCGCA ACATGTTTGT TCGGCCATTA 
GCGACGATGC GTGAGCATTT TGGCCGCATT GCTCAAGGGG ATTTGTCTGG GCAGATCTCG 
GTGACTGGCC GTAATGAAAT CAGCCAGATG TTCGCCAGCT TACGCACCAT GCAGCAGTCG 
CTGATCTCAA CGGTCAGCAA TGTGCGTGAG GGTACCGAAT CGATGTTGAC CGGTATCCAG 
GAAATTTCCG CAGGTAACAA CGATTTATCG GCAAGAACTG AACAGCAAGC GGCTTCCTTG 
GAACAAACTG CCGCGAGTAT GGAACAACTG ACCGCCACGG TAAAACAGAA TGCGGACAAT 
GCGCATCAGG CCACGGTACT GGCGCAAGAG GCTTCCGGTA CGGCAGCTAA AGGCGGAGAA 
CTGACGGCGA GTGTCGTCAC CACCATGCAT GCAATCGCTA CCAGTTCGCA GAAGATTGGT 
GCGATCACCA GCGTTATCGA CGGTATTGCC TTCCAAACCA ATATTTTGGC ACTGAATGCG 
GCCGTGGAGG CGGCCCGTGC GGGTGAGCAA GGGCGTGGTT TTGCGGTGGT TGCGGGTGAA 
GTCCGTAATT TAGCACAACG CAGTGCGCAA GCGGCCAAAG AGATCAAAGG GCTGATTGAT 
GAGTCCGTCA GCCGTGTCCG CCAGGGGTCT ACGCTGGTCG AAAGTGCAGG AACTACCATG 
GAAGAGATCG TCCGCTCGGT GGCGCGTGTG ACTGACATTA TGGGGGAGAT CGAATCTGCT 
TCGGATGAAC AGAGCCGGGG TATTGAACAA ATATCACTCG CCGTAACGCA AATGGATCAG 
GTTACTCAGC AAAATGCGTC ATTAGTGGAA GAGGCCGCGG CGGCAGCCAA TGCACTGGAA 
GAGCAGGCCA GCATGCTCTC CGATGCCGTC TCTGTTTTCC GTTTGGGGCA GGGGCACGAC 
GAACAGTCAG TTGCGGGCAA TAGCCAGCAA TCATTGGCCA CGCATTATTA G

Protein sequence

MFGQIRISTS FFLLLMFLCA IQLISSGLSF TAFRSDYQNL NRVELSSQQR DALSLSWVSL 
LQARNTLNRA ATRSALNVPQ EQVNALMGSA RSALQKAELY FNQFQAVPRL DESESSGQLL 
DATKNSYQNL RSALRELIDF LEAGDLQAFM DQPTQKTQDL FEADFIQYLQ YANEVIADAG 
QQNQQAYQLS IWIFSGAILM VITMAISSLI WLRNMFVRPL ATMREHFGRI AQGDLSGQIS 
VTGRNEISQM FASLRTMQQS LISTVSNVRE GTESMLTGIQ EISAGNNDLS ARTEQQAASL 
EQTAASMEQL TATVKQNADN AHQATVLAQE ASGTAAKGGE LTASVVTTMH AIATSSQKIG 
AITSVIDGIA FQTNILALNA AVEAARAGEQ GRGFAVVAGE VRNLAQRSAQ AAKEIKGLID 
ESVSRVRQGS TLVESAGTTM EEIVRSVARV TDIMGEIESA SDEQSRGIEQ ISLAVTQMDQ 
VTQQNASLVE EAAAAANALE EQASMLSDAV SVFRLGQGHD EQSVAGNSQQ SLATHY