Gene Apre_0083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0083
Symbol
ID	8396834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	104092
End bp	105606
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	40%
IMG OID	644994422
Product	PTS system, N-acetylglucosamine-specific IIBC subunit
Protein accession	YP_003151857
Protein GI	257065601
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR01998] PTS system, N-acetylglucosamine-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000636511
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGAAA AACTACAAAG ATTAGGGCAA TCCCTAATGC AACCAGTCGC TGTAATGCCT 
CTTGCAGCCC TACTTTTGGG TATAGGTTAT GCAATCGACC CAGACTTATG GGGCGGAGGA 
TCACCAATAG CAGCCTTCTT AATATCTGCA GGTGGATCAA TCCTCGACAA TTTAGGTATT 
ATTTTCGCAG TCGGCATAGC ATTCGGTATA GCTCACGACA ACCACGGAGC AAGTGCTCTA 
GCAGGTCTTG TATCATTTTT AACTATTATA AGATTGCTCG CTCCAAACAC AGTAGCCATG 
CTTTCAGGCT TGGATTTAGA AGCATGGACT GCAGCTGATG AATTTAGGGC AACAGCCTTT 
AGTACAATGG GCAACGGCAA TGTATTTGTC GGAATCTTAT CAGGTATTAT CGGTGGATTT 
GCTTACAACA AATTCTTCTC AACAAAACTC CCTGATTTCT TGGCCTTCTT CTCAGGTAGA 
AGACTTGTTC CAATCATGGC ATCATTTATG GCCATGGTCG CTTCAGGAAT TCTTTTTATC 
CTCTGGCCAA TTATTTATGT AGGACTTGTT AATTTCGGAC AAATCCTCCT AAATCTCGGT 
CCAGTAGGTG CAGGAATATA TGCTTTCTTT AACAGACTTT TAATCCCTAC AGGTCTTCAC 
CACGCTCTTA ACCAAGTATT CTGGTTTGAC CTAGTTGGAA TCAACGACAT TCCTAACTTC 
TTAGGAAATG TTCAAGAATC AATAACTAAA GTCTATCACC CAGGTATGTA TCAGGCAGGA 
TTTTTCCCAA TTATGATGTT TGGTCTTCCA GGAGCCGCCC TTGCTATTAT CAAAAAGGCT 
GATAACGACA AGAAAAAGTC AACCAAGGCT ATAATGATAG CAGCAGCTCT AGCATCTTTT 
GCAACAGGAG TTACAGAACC ACTTGAATTT TCATTCATGT TCGCTGCTCC ACAACTTTAC 
CTAATCCACG CAGCTTTTAC CGGCATATCT GCATTTATTG CAGCAAGTCT AAAGGCTTAC 
GCAGGATTTG GTTTTTCTGC AGGTCTAGTA GACTTTATAC TTTCACTCAA AAACCCAATG 
CATGCCAATA TCCTAATACT TATAATTATG GGTATAGTGT ATTTTGCTCT TTACTATTTT 
GTCTTTAGTG CTTTGATAGA AAAATGGGAT ATAGCTACAC CAGGTAGGAA GACAGAAGAT 
ACAGGAAAAG TCAGACCAGA TGATAAAAGC GCACTAGAAG AAGAAAATGA GAAAAAAATC 
GTTCACTCAA ATTCTTATGA GAAAACAGCA GCAAAAATCC TAGAAGGTCT TGGTGGCAAG 
GAAAATATCG ACACAACAAG CTATTGTACA ACAAGACTTA GACTAACAGT CCATGACCAA 
GAAAAGGTAA ATGACGAAAG AATAAAGGAA GCTGGAGTTG CTGGAATCAT GAAACCAGGA 
CCTAAAGCCG TCCAAGTAAT CATTGGACCT CAAGTCCAAG CTGTTTACGA TGAATTTATG 
AAATTAATTA AATAG

Protein sequence

MKEKLQRLGQ SLMQPVAVMP LAALLLGIGY AIDPDLWGGG SPIAAFLISA GGSILDNLGI 
IFAVGIAFGI AHDNHGASAL AGLVSFLTII RLLAPNTVAM LSGLDLEAWT AADEFRATAF 
STMGNGNVFV GILSGIIGGF AYNKFFSTKL PDFLAFFSGR RLVPIMASFM AMVASGILFI 
LWPIIYVGLV NFGQILLNLG PVGAGIYAFF NRLLIPTGLH HALNQVFWFD LVGINDIPNF 
LGNVQESITK VYHPGMYQAG FFPIMMFGLP GAALAIIKKA DNDKKKSTKA IMIAAALASF 
ATGVTEPLEF SFMFAAPQLY LIHAAFTGIS AFIAASLKAY AGFGFSAGLV DFILSLKNPM 
HANILILIIM GIVYFALYYF VFSALIEKWD IATPGRKTED TGKVRPDDKS ALEEENEKKI 
VHSNSYEKTA AKILEGLGGK ENIDTTSYCT TRLRLTVHDQ EKVNDERIKE AGVAGIMKPG 
PKAVQVIIGP QVQAVYDEFM KLIK