Gene Apre_0383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0383
Symbol
ID	8397157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	433346
End bp	435208
Gene Length	1863 bp
Protein Length	620 aa
Translation table	11
GC content	42%
IMG OID	644994741
Product	PTS system, fructose subfamily, IIC subunit
Protein accession	YP_003152153
Protein GI	257065897
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component
TIGRFAM ID	[TIGR00829] PTS system, fructose-specific, IIB component [TIGR00848] PTS system, fructose subfamily, IIA component [TIGR01427] PTS system, fructose subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00944668
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAATTA GAGATTTACT CAAGCCTGAA CTGATGATAT TTGACCTTCA GGCAAATGAC 
AAGATGAGTG CAATTGAAGA AATAGCCTCA AAGTTTTTCG AAAAAGGTTA TGTAAAAGAT 
AAAGAAGACT TCAAAAATGG ACTTATAGCA AGAGAAGAAG AAGGATCAAC TGCCCTAGGT 
GAGTCAGTAG CCATCCCTCA CACCAAAAAC GAAACTGTTA AGGAACCTGC AGTTTTATTT 
GCAAGAAAAG TAGGAGGACT TGACTATGAA GCCTTAGACG GAGAGCCAAC AGAAATATTT 
TTCGCCATAG GAGCACCAGC GGGAGAAAAC AACCTCCATG TAGAAACCCT AGCCGAGCTT 
TCAAAAATGA TTATGAAAGA AGGCTTCATC GATGATCTTA AGAAATGTTC TAGCGAAGAA 
GAAGTCTACG GAGTAATCGA CAAATACTCA GAGAAAAAGA AGGCCCCAGT AGTTGAAGAA 
ACTACAAATA GCGATATCAA ATTACTAGCA GTAACAGCTT GTCCAAACGG TATAGCCCAC 
ACCTACATGG CCCAAGAAGC CCTAGAAAAG GCAGCCAAAA AGGCAGGGGT TTCAATCAAG 
GTCGAGACAA ATGGGTCTGA TGGAATAAAA AATAGACTAA CAGCCAAGGA AATCGAAGAA 
GCTGATGCTA TAATCATTGC AGCAGATAAG AAAGTCGAAA CAAATAGGTT CGATGGCAAA 
AGACTTATCC AAAGACCAGT ATCTGACGGA ATCAGAAAAA GTGATGAACT AATCGAAAAG 
GCCATCAAGG GCGAAGGAAG AATCTTTACC GCAGAAGAAG GAGCAAGTAA GGGAAGTGAT 
GACGATGGCG AAGGTCAAAG CTTCTGGCAA AAGATTTACG GAGACCTAAT GAATGGAATT 
AGCCACATGC TACCATTTGT AATCGGTGGT GGAATCCTCA TGGCAATCTC CTTCCTAGTA 
GAAAGATTCG CAGGAGATGA ATCCCTTGCC TTCACTTTCC TAAATGGTCT TGGAGGGGAT 
GCCTTTAGCT TCCTAATACC AATCCTTGCA GGCTTTATTG CCATGTCAAT TGGAGATAGA 
CCAGCCCTAA TGCCTGGTAT GGTTGCAGGA CTTATGGCAA GCCGTGGAGC AGGCTTTATC 
GGTGGACTAA TCGGAGGTTT CCTTGCAGGT TATGTAGTTA ATTTACTAAA GAAAGCCTTC 
AGAAATCTTC CAAAATCAGT CGAAGGCCTA AAGCCAATGC TAATCTATCC AGTATTTGGT 
CTTTTAATCG TTGGAGCCTT GATGTTCTTT ATCATAGACC CAATATTTAC TGGAATCAAT 
ACCTTCATTA ACAACTGGTT AATGAGCCTA TCTGGAGCTA ATATGCTTCT TCTAGGAGCA 
ATCCTTGCAG GCATGATGGC AATAGATATG GGTGGTCCTA TCAACAAGGC AGCTTACGCC 
TTCGCAATCG GAGCCTTCAC AGATACAGGA ATAGGAACCT TTATGGCAGC TGTAATGGTT 
GGAGGAATGG TTCCACCAAT TGCAATAGCA ATAGCAACAA CATTTTTCAA AGATAAATTT 
ACAGAAGATC AAAAGAAGAC TACAATTACC AACTACATCT TGGGTCTAAG CTTTATAACA 
GAAGGAGCAA TTCCTTTCGC AGCTGCGGAA CCAACTAAGG TAATCCCAGC TAGTGTTATA 
GGATCAGCTA TAGCAGGAGC AATAGTTGGA GGCTTTAACA TATCAGCCCC AGCCCCACAC 
GGAGGAATCT TCGTATTGCC AGCTATGTCA AGCCTAAGCC AAGCCCTAAT CTTTGTAGGA 
TCTGTATTAG TAGGTGCAAT AGTTGGTGGT CTAATCTACG GATTTATCAA AAAGAAAGAT 
TAA

Protein sequence

MEIRDLLKPE LMIFDLQAND KMSAIEEIAS KFFEKGYVKD KEDFKNGLIA REEEGSTALG 
ESVAIPHTKN ETVKEPAVLF ARKVGGLDYE ALDGEPTEIF FAIGAPAGEN NLHVETLAEL 
SKMIMKEGFI DDLKKCSSEE EVYGVIDKYS EKKKAPVVEE TTNSDIKLLA VTACPNGIAH 
TYMAQEALEK AAKKAGVSIK VETNGSDGIK NRLTAKEIEE ADAIIIAADK KVETNRFDGK 
RLIQRPVSDG IRKSDELIEK AIKGEGRIFT AEEGASKGSD DDGEGQSFWQ KIYGDLMNGI 
SHMLPFVIGG GILMAISFLV ERFAGDESLA FTFLNGLGGD AFSFLIPILA GFIAMSIGDR 
PALMPGMVAG LMASRGAGFI GGLIGGFLAG YVVNLLKKAF RNLPKSVEGL KPMLIYPVFG 
LLIVGALMFF IIDPIFTGIN TFINNWLMSL SGANMLLLGA ILAGMMAIDM GGPINKAAYA 
FAIGAFTDTG IGTFMAAVMV GGMVPPIAIA IATTFFKDKF TEDQKKTTIT NYILGLSFIT 
EGAIPFAAAE PTKVIPASVI GSAIAGAIVG GFNISAPAPH GGIFVLPAMS SLSQALIFVG 
SVLVGAIVGG LIYGFIKKKD