Gene YpAngola_A1443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1443
Symbol
ID	5799910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	1497614
End bp	1498768
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	50%
IMG OID	641339397
Product	major facilitator transporter
Protein accession	YP_001605961
Protein GI	162421391
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00314587
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA AAATACACCA ACAAGCAGTA CAGCCCGGTA TTAGCCAACA AGTTTCTACC 
CGGTTAGCTT TTTTTATTGC CGGGTTAGGC ATGGCCGCTT GGGCACCACT TGTTCCCTTT 
GCAAAAGCGC GCATTGGTCT TAATGATGCC TCATTGGGTT TATTACTGTT ATGCATTGGT 
ATTGGATCGA TGCTGGCGAT GCCGCTCACT GGCGTGCTTA CCGCGAAGTG GGGCTGTCGG 
GCCGTCATTT TACTGGCAGG CGCAGTGCTC TGTTTAGATT TGCCTTTACT CGTATTGATG 
AATACTCCCG CGACGATGGC TATCGCACTA TTAGTATTCG GTGCAGCTAT GGGCATAATA 
GATGTGGCGA TGAACATTCA GGCTGTCATT GTTGAAAAAG CCAGTGGCCG GGCGATGATG 
TCTGGCTTCC ACGGTTTATT CAGTGTCGGT GGGATTGTTG GTGCAGGAGG TGTCAGTGCT 
CTATTGTGGC TAGGCCTCAA CCCACTGACA GCGATTATGG CTACCGTAGT ACTCATGATT 
ATTTTGCTGC TGGCAGCCAA TAAGAATCTG TTACGTGGCA GCGGTGAACC CCATGATGGG 
CCATTGTTTG TTTTTCCCCG TGGCTGGGTG ATGTTCATCG GCTTTTTATG TTTTGTCATG 
TTTTTGGCAG AAGGCTCGAT GCTTGACTGG AGTGCCGTCT TCCTGACGAC GCTACGCGGC 
ATGTCGCCAT CACAAGCAGG TATGGGCTAC GCCGTATTCG CCATCGCTAT GACACTTGGC 
CGCCTAAACG GTGATCGGAT TGTCAATGGG CTGGGCCGTT ACAAGGTCTT ATTAGGTGGC 
AGTTTATGTT CTGCCATCGG GATTATTATC GCAATCAGTA TTGATAGCTC AATGGCTGCC 
ATTATTGGCT TCATGTTAGT GGGTTTCGGC GCATCGAATG TGGTACCGAT CTTGTTTACC 
GCCGCAGGTA ATCAAACCGT TATGCCTGCC AACCTGGCGG TTGCGTCAAT TACAACGATC 
GGTTACGCGG GAATTTTGGC TGGCCCGGCA GCTATCGGCT TTATTGCACA ATTAAGTAGT 
CTATCGGTTG CTTTTGGCTG TGTAGCACTT CTGTTATTAA CCGTTGCTGC CAGCGCCAGA 
GCCGTCACGC GCTAA

Protein sequence

MSTKIHQQAV QPGISQQVST RLAFFIAGLG MAAWAPLVPF AKARIGLNDA SLGLLLLCIG 
IGSMLAMPLT GVLTAKWGCR AVILLAGAVL CLDLPLLVLM NTPATMAIAL LVFGAAMGII 
DVAMNIQAVI VEKASGRAMM SGFHGLFSVG GIVGAGGVSA LLWLGLNPLT AIMATVVLMI 
ILLLAANKNL LRGSGEPHDG PLFVFPRGWV MFIGFLCFVM FLAEGSMLDW SAVFLTTLRG 
MSPSQAGMGY AVFAIAMTLG RLNGDRIVNG LGRYKVLLGG SLCSAIGIII AISIDSSMAA 
IIGFMLVGFG ASNVVPILFT AAGNQTVMPA NLAVASITTI GYAGILAGPA AIGFIAQLSS 
LSVAFGCVAL LLLTVAASAR AVTR