Gene YpAngola_A3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3960
Symbol
ID	5802438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	4212391
End bp	4213722
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	46%
IMG OID	641341746
Product	CBS/transporter associated domain-containing protein
Protein accession	YP_001608256
Protein GI	162419427
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.216105
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAATA GTATCTTACT GATTCTTTTT TTAATTGCGG TCAGCGCCTT CTTCTCGCTA 
TCAGAGATTT CATTGGCGGC TTCACGCAAA ATTAAACTAA AACTGCTGGC GGACGAGGGC 
GATACCAACG CCTTACGAGT CCTGAAACTG CAAGAGACGC CAGGAATGTT CTTCACCGTG 
GTCCAAATTG GCCTGAATGC TGTCGCCATT CTTGGTGGTA TTGTCGGTGA TGCCGCTTTC 
TCCCCTTCGT TCAAACTCGT TTTTGAGCGT TTTATGGCTC CTGAGTTGGC CGATCAAGCC 
TGTTTCGTTT GTTCTTTCGT GTTAGTGACC AGCTTATTTA TTCTGTTTGC TGATTTAACC 
CCGAAACGCA TCGGTATGAT TTCACCTGAA GCGGTTGCCG TCCGGATCGT CAACCCAATG 
CGCTTCTGCC TAATGATCTT CCGCCCATTA GTCTGGTTCT TCAATGGGAT GGCAAATCTT 
ATCTTCCGCC TATTTAAATT ACCCATGGTC CGTAACGATG ACATCACTTC CGATGATATC 
TATGCCGTGG TAGAAGCCGG TGCGCTCGCC GGAGTGCTAC GCAAGCAAGA GCATGAGTTG 
ATTGAAAACG TCTTTGAGCT GGAGTCTCGA ACCGTTCCTT CCTCCATGAC TTCACGTGAA 
AACGTGATTT ACTTTGATCT ACGGGAAAGC GAAGACAGTA TCAAAGATAA AATCTCCACA 
CATCCGCACT CAAAATTCCT GGTATGTGAT GGCCACATTG ACCAAGTGGT GGGTTACGTT 
GACTCTAAAG ACTTGCTGAA TCGGGTATTA GGTAACCAAA GTCTGGTACT CAGCAGTGGC 
GTACAAATTC GTTCAGCTCT GATTGTGCCA GATACATTGA CACTTTCAGA AGCGTTGGAG 
AGTTTTAAAA CCGCGGGTGA AGACTTCGCC GTGATCCTCA ACGAATATGC TTTAGTTGTT 
GGGATAATTA CACTGAATGA CGTAATGACC ACGTTGATGG GCGATTTAGT TGGCCAAGGG 
CAGGAAGAGC AAATTGTTGC CCGCGATGAG AATTCATGGC TGATTGAGGG CGGTACACCG 
ATTGAAGATG TCATGCGCGT ACTGCATATC GACGATTTCC CGCAATCGGG CAATTATGAA 
ACTATCGGCG GCTTTATGAT GTATATGCTG CGTAAAATTC CTAAACGAAC TGATTTTGTT 
AAATATGCGG GTTACAAATT TGAAGTCGTC GATATTGATA GCTACAAGAT AGATCAGCTA 
CTGGTGACAA GGCTCAGTGA CCAGCCAGCG CCAATCCTGC CAAAAGCACC ACACGAAAGC 
AGTGACGCCT AG

Protein sequence

MLNSILLILF LIAVSAFFSL SEISLAASRK IKLKLLADEG DTNALRVLKL QETPGMFFTV 
VQIGLNAVAI LGGIVGDAAF SPSFKLVFER FMAPELADQA CFVCSFVLVT SLFILFADLT 
PKRIGMISPE AVAVRIVNPM RFCLMIFRPL VWFFNGMANL IFRLFKLPMV RNDDITSDDI 
YAVVEAGALA GVLRKQEHEL IENVFELESR TVPSSMTSRE NVIYFDLRES EDSIKDKIST 
HPHSKFLVCD GHIDQVVGYV DSKDLLNRVL GNQSLVLSSG VQIRSALIVP DTLTLSEALE 
SFKTAGEDFA VILNEYALVV GIITLNDVMT TLMGDLVGQG QEEQIVARDE NSWLIEGGTP 
IEDVMRVLHI DDFPQSGNYE TIGGFMMYML RKIPKRTDFV KYAGYKFEVV DIDSYKIDQL 
LVTRLSDQPA PILPKAPHES SDA