Gene Apre_0473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0473
Symbol
ID	8397248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	539973
End bp	541418
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	40%
IMG OID	644994830
Product	PTS system, trehalose-specific IIBC subunit
Protein accession	YP_003152241
Protein GI	257065985
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR01992] PTS system, trehalose-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAT ATACAGATGA TGCGAAGCTT TTGCATCAAT ATATTGGAGG AGATAGTAAT 
ATCTCATCTG TTACGCATTG TGTTACCAGG ATGCGTTTTG TACTAAATGA TCCAAAGAAG 
GCGGATGTAG AAAAAATCGA AGATCTTCCT TCAGTGAAAG GATCTTTCAC CCAGGCTGGC 
CAATTTCAGG TTATTATTGG AAACGATGTA GATGAGTTTT ATAATGACTT CATGGCTATA 
TCACACGCCA CAGAAAAGAG CAAGGATGAA GTAAAAAAGG ATGCTGTGAA AAACCAGAAC 
GCCCTTCAAA GGGTATCTTC AGTCCTTGCG GAAATCTTTG CGCCTTTAAT TCCAGCTATT 
ATCGTAGGTG GTTTGCTCTT AGGTTTTAGA AATATTCTTG GAGAGATGCC TTTTGATAGT 
CTTGGAGGAA AGACAATCGT AGAGACTTCT GTTTTTTGGA ATGGGGTAAA TGACTTCTTG 
TGGCTTATAT GTGAAGCAAT CTTCCACTAC CTACCAGTAG GGATCACCTG GTCTATCACA 
AGGAAGATGG GTATAACCCA AATTCTAGGA ATTGTTCTAG GTATTTGTTT GATTTCACCT 
AACCTACTTG CCAATGCATA TTCAATAGCA GGTGGGGGAG AAATTCCTGT CTGGGACTTT 
GGATTCTTCA CAATAGAAAG AATTGGCTAC CAAGCCCAGG TAATCCCAGC CATGCTTGCA 
GGCTTCCTCT TGGTTTATCT TGAAAGATTC TTCAAGAAGG TCATCCCTCA AGCAATATCA 
ATGATTTTTG TTCCCCTATT TTCACTCATA CCAACAGTAC TTCTAGCTCA CTTAGTCCTA 
GGTCCTATTG GTTGGAAGAT AGGCTCACTA ATCTCTGCAG GAGTATATAA TGGATTGACC 
TCAGCCTTTA ACTGGCTATT TGCTGCAGTA TTTGGTTTCT TCTATGCGCC ACTTGTTATT 
ACAGGACTTC ACCATATGAC AAATGCAATC GACCTTCAGC TTGCAAATGA CTTCGGTGGA 
ACAATCCTTT GGCCAATGAT TGCCCTATCA AACATTGCCC AAGCCTCAGC AGTAGTAGCT 
ATAATCTACC TACACAGAAA AGACGAGAAG GAGAAACAAA TCTCAGTTCC AGCAGCAATT 
TCTGCCTATC TTGGAGTTAC AGAGCCTGCT CTTTTTGGTA TCAATATCAA ATACGGCTTC 
CCATTTATAG CGGGAATGAT TGGATCTGCC CTTGCAGCGG TATTTTCTGT ATCAACTTCA 
ACCATGGCCT ACAACATAGG TATAGGTGGA CTTCCTGGAA TTCTTTCAAT AATGGGAGGA 
TCTAGGTTAA ACTTCGCCAT ATCCATGGCT ATTGCAATAG TTGTGCCTGT AGTACTTACT 
GTAGTATTTG AAAAGAAGAA AATGTTTCAT AACAAGATAG AATTTAAGAC ACCAAGTTTT 
AGCTAG

Protein sequence

MGKYTDDAKL LHQYIGGDSN ISSVTHCVTR MRFVLNDPKK ADVEKIEDLP SVKGSFTQAG 
QFQVIIGNDV DEFYNDFMAI SHATEKSKDE VKKDAVKNQN ALQRVSSVLA EIFAPLIPAI 
IVGGLLLGFR NILGEMPFDS LGGKTIVETS VFWNGVNDFL WLICEAIFHY LPVGITWSIT 
RKMGITQILG IVLGICLISP NLLANAYSIA GGGEIPVWDF GFFTIERIGY QAQVIPAMLA 
GFLLVYLERF FKKVIPQAIS MIFVPLFSLI PTVLLAHLVL GPIGWKIGSL ISAGVYNGLT 
SAFNWLFAAV FGFFYAPLVI TGLHHMTNAI DLQLANDFGG TILWPMIALS NIAQASAVVA 
IIYLHRKDEK EKQISVPAAI SAYLGVTEPA LFGINIKYGF PFIAGMIGSA LAAVFSVSTS 
TMAYNIGIGG LPGILSIMGG SRLNFAISMA IAIVVPVVLT VVFEKKKMFH NKIEFKTPSF 
S