Gene Apre_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0200
Symbol
ID	8396951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	226527
End bp	227516
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	39%
IMG OID	644994538
Product	protein-N(pi)-phosphohistidine--sugar phosphotransferase
Protein accession	YP_003151973
Protein GI	257065717
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3444] Phosphotransferase system, mannose/fructose/N-acetylgalactosamine-specific component IIB
TIGRFAM ID	[TIGR00824] PTS system, mannose/fructose/sorbose family, IIA component

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000259121
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGGAA TAATACTCGC AAGCCACGGC GGTTTTGCCG ATGGTATCAA AGAATCCGCT 
CAAATGATCT TTGGCGAGCA AGAAAAATTC GAATCAGTAT GCCTACTACC TTCAATGGGA 
CCCGATGATT TTAGAGCAAA TCTCGAAAAA GCCATTGAAA AATTAGATAC TGAAGAGATT 
CTTTTCTTGG TTGACCTTTG GGGCGGTACA CCATTTAACC AAAGCTCAAA TTTATTTGAG 
GGAAACGAGG ATAAATGGGC AATCGTTGCT GGCATGAACC TTCCTATGGT TATAGAAGCT 
TTAAGCGAGA GATTTACTGC AGAGAAATCT CATGATATAG CAAAGGCTAT AGTAGGATCA 
GCCAAAGAAG GAGTTAAGAT TAAGCCGGAA GATCTTAACC CAGTAGAAGA AGCGAAAACA 
GAAGTCAAGG AAGATAATAT TCCTAAGGGA TCTATCCCAG AAGGAACAGT TCTTGGAGAT 
GGTAAGATCG ATATTGGTCT TGCAAGAATA GACACAAGAC TTCTCCACGG ACAAGTCGCT 
ACAAGCTGGA CAAAGTCAAT AAATCCTGAC AGAATCATAG TTGTAAGTAA TAGCGTAAGC 
AAAGACGAGC TAAGAAAGAA CATGGTAATG GAAGCAGCTC CTCCAGGAGT TAAGGCTCAC 
GTAATCCCTA TTTGGAAGAT GAAGGAGATT ATGGATGATC CACGTTTTGG AGCAACTCGT 
GCTTTATTAT TGTTTGAAAA ACCACAAGAT GTCCTAGAAT TCCTAGAACT AGGCGGAAAG 
CTAGATAAGG TTAACCTAGG ATCAATGGCT TACAAACAAG GAGATATCAA CCTTACAAAC 
GCTGTTTCAA TGAATGCTGA TGATGTTAAA TGTTTTGACA AAATCCTAGA ATACGGAATA 
AAGATCGATG TCAGAAAAGT TCCAGCAGAC AAGAACGAAA ATTTCGACAA CTTGATGAAA 
AAAGCTAAAA GAGAATTAAA TATTAATTAA

Protein sequence

MVGIILASHG GFADGIKESA QMIFGEQEKF ESVCLLPSMG PDDFRANLEK AIEKLDTEEI 
LFLVDLWGGT PFNQSSNLFE GNEDKWAIVA GMNLPMVIEA LSERFTAEKS HDIAKAIVGS 
AKEGVKIKPE DLNPVEEAKT EVKEDNIPKG SIPEGTVLGD GKIDIGLARI DTRLLHGQVA 
TSWTKSINPD RIIVVSNSVS KDELRKNMVM EAAPPGVKAH VIPIWKMKEI MDDPRFGATR 
ALLLFEKPQD VLEFLELGGK LDKVNLGSMA YKQGDINLTN AVSMNADDVK CFDKILEYGI 
KIDVRKVPAD KNENFDNLMK KAKRELNIN