Gene Apre_1583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1583
Symbol
ID	8398395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1719778
End bp	1721091
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	34%
IMG OID	644995947
Product	PTS system, lactose/cellobiose family IIC subunit
Protein accession	YP_003153325
Protein GI	257067069
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGAAA CAAATAAAAT AAGCTTCATG GACAAGTTTA CTGAAGCTGC TATGAAATTT 
GGTGCTCAAG TACACCTTCG CTCACTTAGG GATGCCTTCG CAATAATGAT GCCCCTATTT 
ATATTAGCAG GTCTTGCGGT ATTAATAAAT TCTGTAATAT TTCCTAAAAT ATTAAGTGAA 
AGTGCCATTC AAACAGCAGG ACATTGGGCA ACTTCTATAG CAAATGCTAC CTTAAATGTT 
TCTGGATTAA TCTTGTGTGG AATAATAGGT TATACTCTAT CTAAAAATAA AGGTTACAAA 
AGTCCTTATA CATGTGTAAT GATAGCTATA GCAGCATTAA TTGTAATGAT GCCACAAACA 
CTAAAAATAG CGGCTACTGA TGGATCTGAA GTTGAAGTGG GAGGAATCTT AACCTATGGA 
AACCTTGGTA CCTCTTCAAT GTTTGCGGGT ATTATTGTAG GTTTATTGTC TACTGAAATT 
TATTTGAGAC TTTCTAAAAT TGATAAGTTA AGGGTAAATA TTGGTGGAGA TGTACCACCA 
CAAGTAAATG CATCCTTTAA TAATATGATT CCTGCCATGC TATCAATTAT TATATTCTCT 
ATTGTAAGTT TTGTGCTATA CTCAGTATTT AATACAGACT TAATAACTTT GATAACAACA 
ATGATTCAAG AGCCTTTGAG GAAAGTAAAC ACTTCTCTTG TTGGTACAGT ATTGATATAC 
AGCTTTGGAA ACTTATTGTT CACATTCGGT ATTCACCAAA CAGTAGTAAA TGGAACAATC 
CTTGAACCAT TGCTTCTTGT AAATATGAAT GAGAATATGG CAGCTGCAGC AGCAGGCAAA 
GAGATTCCTC ATATAATTAA TTCTACATTC GTCCCAACAT TTGGCATGCT AGGTGGTACT 
GGTTCAACAA TATGCTTGTT AATTGCAGCA TTCCTATTTT TCAGGAAAAA TCAACAATAC 
AGTGAATTAG GGAAATTAGC TGTAGCTCCA GGATTATTTA ATATAAACGA ACCTGTTATA 
TTTGGTTTCC CTATAGTGTT CAACTTGCCA ATGATAATAC CTTTCGTATT GACTCCAGCT 
ATAGGAATTA TAATAGCTTA TTTTGCAACA GCAATAGGTT TTATGAATAA ATGTACAGTG 
CTTGTGCCTT GGACTACTCC TCCATTATTA AATGGATTTT TAGCAACTGG AGGAGACTTC 
AGAGCTATTA TAGTTCAATT AGTGATAATT ATTATAGGTG TACTATTATA CTTGCCATTT 
ATGAAGATAA GTGAAAGAGT AAGCAGAAAA CAAGCAGAAG CTTTAAATAA CTAG

Protein sequence

MTETNKISFM DKFTEAAMKF GAQVHLRSLR DAFAIMMPLF ILAGLAVLIN SVIFPKILSE 
SAIQTAGHWA TSIANATLNV SGLILCGIIG YTLSKNKGYK SPYTCVMIAI AALIVMMPQT 
LKIAATDGSE VEVGGILTYG NLGTSSMFAG IIVGLLSTEI YLRLSKIDKL RVNIGGDVPP 
QVNASFNNMI PAMLSIIIFS IVSFVLYSVF NTDLITLITT MIQEPLRKVN TSLVGTVLIY 
SFGNLLFTFG IHQTVVNGTI LEPLLLVNMN ENMAAAAAGK EIPHIINSTF VPTFGMLGGT 
GSTICLLIAA FLFFRKNQQY SELGKLAVAP GLFNINEPVI FGFPIVFNLP MIIPFVLTPA 
IGIIIAYFAT AIGFMNKCTV LVPWTTPPLL NGFLATGGDF RAIIVQLVII IIGVLLYLPF 
MKISERVSRK QAEALNN